destoon采集论坛

 找回密码
 立即注册
查看: 141|回复: 0

重复信息检测的好方法? 给官方一些思路!

[复制链接]

75

主题

85

回帖

589

积分

高级会员

Rank: 4

积分
589
发表于 2012-1-13 10:41:10 | 显示全部楼层 |阅读模式
信息重复一直困扰使用B2B系统的用户。无意之中和一个大型B2B网站技术聊天,问了下他们是怎么处理重复信息的。他说使用“哈希值”。第一次听说这个东西 也不懂具体是什么意思,是怎么工作的。
我问他效果怎么样,他说很好。
搜索了下“哈希值”http://baike.baidu.com/view/1051156.htm
希望这个建议能给官方解决信息重复检测,一点思路和方向。

[ 本帖最后由 524pin 于 2012-1-13 10:42 编辑 ]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|destoon采集论坛

GMT+8, 2025-11-23 09:23 , Processed in 0.014832 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表