![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
信息检索
文章平均质量分 86
火贪三刀
这个作者很懒,什么都没留下…
展开
-
使用lucene搜索引擎实现对关键字的简单查询
最近闲来无事,就摸索着在之前做的社区论坛课程设计上,实现一个对发表帖子进行搜索的功能。通过百度查询,接触并初步学习了一下lucene,也是新手,写出来当做总结吧。 lucene是一个非常优秀的全文检索引擎,使用lucene需要用到apache开源组织提供的lucene-core jar包,可以在官网http://www.apache.org/dyn/closer.cgi/lucene/原创 2014-03-19 22:01:03 · 1725 阅读 · 0 评论 -
搜索引擎倒排索引表压缩:gamma编码、Golomb编码
搜索引擎的倒排索引表所占的空间很大,对倒排索引表进行压缩显得非常必要。由于倒排索引表中存储的全部都是数字,对其进行压缩有着专门的方法,Gamma编码就是其中之一。当你每天打开电脑,在百度搜索框中输入你要搜索的内容,按下回车之后,你可能不会意识到,有无数台主机在飞速运转,对比了数百万条记录,经过初步结果集生成、相关度打分、结果排序、摘要生成之后,才最终在你的屏幕上打出了你想要的结果。这一切仅仅发生在几转载 2016-03-16 22:20:38 · 2604 阅读 · 0 评论