![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
信息检索导论
文章平均质量分 84
二维映射三维
这个作者很懒,什么都没留下…
展开
-
信息检索导论——六、文档评分、词项权重计算及向量空间模型
参数化索引及域索引迄今为止,我们都将文档看成一系列词项的序列.实际上,大多数文档都具有额外的结构信息.数字文档通常会把与之相关的元数据(metadata)以机读的方式一起编码.所谓元数据,指的是和文档相关的一些特定形式的数据,比如文档的作者,标题以及出版日期等等.问题:考虑查询"寻找由William Shakespeare 于 1961年撰写,其中包含短语alas po转载 2016-07-11 17:00:07 · 4632 阅读 · 0 评论 -
信息检索导论——一、布尔检索
Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on comput原创 2016-07-13 11:01:07 · 890 阅读 · 0 评论 -
信息检索导论——五、索引压缩
注:本文红蓝字为转载http://www.cnblogs.com/tekkaman/p/3575434.html其余为自己添加,课件网址http://www.doc88.com/p-648858797791.html【Heaps定律】词项数目的估计其中M是词项数目,T是文档集合中的词条个数,参数k和b的典型取值为:30≤k≤100,b≈0原创 2016-07-08 14:31:43 · 1019 阅读 · 0 评论 -
信息检索导论——四、索引构建
1、硬件基础2、基于块的排序索引方法3、内存式单遍扫描索引构建算法4、分布式索引构建5、动态索引构建6、安全性和排序式检索中的索引问题原创 2016-07-07 20:23:53 · 2591 阅读 · 0 评论