![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
全文检索
zhaolei415
踏踏实实做程序。
展开
-
lucene影响索引速度的因素-MergeFactor, MaxMergeDocs, RAMBufferSizeMB
版本:Java lucene2.4在索引算法确定的情况下,最为影响Lucene索引速度有三个参数--IndexWriter中的 MergeFactor, MaxMergeDocs, RAMBufferSizeMB 。这些参数无非是控制内外存交换和索引合并频率,从而达到提高索引速度。当然这些参数的设置也得依照硬件条件灵活设置。MaxMergeDocs该参数决定写入内存索引文档个数...原创 2011-01-14 10:07:28 · 100 阅读 · 0 评论 -
[转]Lucene倒排索引原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,...原创 2010-11-22 10:30:59 · 80 阅读 · 0 评论 -
solr/lucene影响分数的因素
Lucene文档得分计算原理:首先要理解下文档与词条的向量空间我们先来说下文档(document)和其中包含的词条(term)之间的关系,对于每篇文档它是由词条组成的因此可以表示成一个向量D(term1,term2,......,termn)。我们假设有两篇文档同时出现了term1和term2,那么我们用一个二维坐标系来表示文档和词条之间的关系。如下:[img]http://dl.it...2011-12-26 22:04:50 · 138 阅读 · 0 评论