Lucene4.0 包含大量的新特性以及性能的提升。
本文先小测试,实现一个倒排的查找,找到所查询的词的所在文档以及所在文档的位置信息。
Lucene4.0 一大新特性即为灵活索引,索引结构更加透明化,增加了索引统计机制,所有的搜索逻辑现在针对每个segment上工作。IndexReaer 也被完全重构,变成了:Atomic 和 Composite Reader。
这个变化比较大,我们知道Lucene在生成索引的时候会先生成小的Segment然后逐渐合并成大的Segment。Lucene的所有结构和组件都是以多个Segment为导向进行设计架构的。为搜索多个Segment需要MultiReader,而多Reader的会导致在搜索TermEnum 或者 Postings 的时候搜索效率的下降。因此新的Reader去掉了MultiReader,以Atomic和Composite Reader 代替。
lucene4.0 倒排枚举类型API如下图:
代码如下: