搜索引擎
文章平均质量分 81
KungWahCheung
博学、慎思、明辨、笃行。
展开
-
向量空间模型
词项权重计算词项频率(term frequency)在布尔检索模型中,只考虑了词项在文档中出现与否,给定一个布尔查询,一篇文档要么满足查询要求要么不满足,返回的文档没有排序。对于Web搜索引擎,用户往往需要浏览非常多的网页才能找到需要的信息。如何才能对检索的文档进行评分和排序呢,一个合理的想法是,如果一篇文档包含的查询词的数目越多,那么这篇文档与查询相关的可能性就越高,就意味着更可能是用户所需要的文原创 2017-10-12 19:38:38 · 2029 阅读 · 0 评论 -
布尔检索模型
最近在看《Introduction to Information Retrieval》(中文版为《信息检索导论》,下文简称为“IR”),是最经典的信息检索书籍之一了。由于淞姐要求我细读这本书然后跟同事分享,就有了这个版块,之后会陆续添加后续章节内容。即使是站在巨人的肩膀上了(看了中文版和英文版IR,也从网上搜集了不少内容),但很多细节往往还是需要自己用心体会。从一个读者到一个讲解人,在第一次做分享原创 2017-10-08 20:53:01 · 15803 阅读 · 3 评论