提高Lucene索引性能

提高Lucene索引性能 当索引的文件不多时,用 Lucene 默认的设置就能得到很好的性能。但是,如果索引大量文件,就得通过一些手段去提高 Lucene 索引性能。  1、  索引性能差的原因  1)        Lucene 索引过程       在索引文件的过程中, Lu...

2012-09-21 16:09:27

阅读数 12

评论数 0

改进lucene的打分算法

这个是从别人的文章转过来的,记录一下,做全网搜索的时候可能会有用   Lucene基础排序算法: score_d = sum_t(tf_q * idf_t / norm_q * tf_d * idf_t / norm_dt_t) score_d: Document(d...

2012-09-21 16:02:03

阅读数 42

评论数 0

Bobo源码笔记7(RangeFacetHandler)

对于范围过滤分组计数的应用,bobo采用RangeFacetHandler解决问题。RangeFacetHandler的其他部分与SimpleFacetHandler差不多,主要区别在getFacetCountCollector()函数这边 ,返回的是RangeFacetCountCollec...

2012-09-13 18:02:19

阅读数 14

评论数 0

Bobo源码笔记6(结果的筛选和收集(2))

browse()函数的最后部分,是对分组计数结果的一个整理:   finally { //每个Facet对应一个FacetHitCollector  for (FacetHitCollector facetCollector : facet...

2012-09-06 17:49:10

阅读数 13

评论数 0

Bobo源码笔记2(创建FacetValidator)

在browse()函数中有这样一段代码。这段代码做了两件事:一,根据每个facet的过滤条件创建filter;二,根据每个facet的分组计数规则创建FacetHitCollector :   for (String name : fields)//对应于每一个Facet {...

2012-09-05 17:39:04

阅读数 7

评论数 0

Bobo源码笔记5(结果的筛选和收集)

  当BoboSubBrowser的browse()函数创建好filter和collector以后,那么就进入最后的阶段了,从索引中获取倒排表,进行过滤和收集,这一过程在类BoboSearcher2的search()函数中实现:   public void search(Weight wei...

2012-09-05 11:16:32

阅读数 12

评论数 0

Bobo源码笔记4(collector的创建)

Bobo的收集器基类是SortCollector继承于lucene的Collector类,其中函数是获取收集器的外部接口:   public static SortCollector buildSortCollector(Browsable browser,Query q,SortField[...

2012-09-03 16:03:14

阅读数 7

评论数 0

提示
确定要删除当前文章?
取消 删除