信息检索
文章平均质量分 79
肥萝卜使大力
这个作者很懒,什么都没留下…
展开
-
网页消重算法(via北大天网课题组)
算法基础当前比较成功的搜索引擎系统大多是基于关键词匹配和结合向量空间模型来完成用户的检索请求的。典型的系统包括Google和天网系统。通常这类系统在对已抓取回来的网页进行分析时,要提取网页中出现的关键词和摘要信息,并以关键词作为网页的特征项。天网系统在搜集并分析一篇网页时,提取并记录了网页中出现的关键词,同时根据公式赋予每个关键词一个权值,这些关键词的权值构成一个向量空间,可以用来转载 2012-06-12 16:57:55 · 1343 阅读 · 0 评论 -
PageRank与TrustRank
PageRank开辟了链接分析的道路,成为搜索引擎网页排名算法的典范,使搜索质量获得绝对的提升,成就了Google如今的地位,也为人们提供了更丰富和准确的信息。当从介绍该算法的原始论文(1999年)引用量(3983)即可看出其重要性。但如今,它已光辉不再,是何原因?这里向你拉开推测大幕的一角! 曾几何时,有一家叫Altavista的搜索引擎公司。它是如此强大,被认转载 2012-06-12 17:13:26 · 3293 阅读 · 0 评论