Lucene 索引文件的读取(七)之tim&&tip

本文深入探讨了如何从Lucene的索引文件.tim和.tip中,通过TermRangeQuery获取满足条件的term集合。文章通过BlockTreeTermsReader介绍了FieldReader对象的生成及其在内存中的表示,详细阐述了FieldSummary、IndexStartFP和FST的导入模式(off-heap和on-heap)。此外,还讨论了不同导入模式下的数据存储策略。
摘要由CSDN通过智能技术生成

本篇文章开始介绍索引文件tim&&tip的读取,通过TermRangeQuery的例子来介绍如何从索引文件.tim&&.tip中获取满足查询条件的所有term。

  为了便于介绍,使用了文章Automaton(二)中提供的例子:

图1:

  结合图1的例子,获取满足查询条件(第79行代码)的所有term的过程可以简单的用一句话来描述:根据域名"content",从索引文件.tim&&.tip中获取该域对应的term集合,随后遍历集合中的每一个term,使用DFA(见文章Automaton(二))筛选出满足条件的term,流程图如下所示:

获取满足TermRangeQuery查询条件的term集合的流程图

图2:

BlockTreeTermsReader

图3:

  在介绍BlockTreeTermsReader的概念或者说包含的信息之前,我们先简单的介绍下该对象的生成时机点,在生成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值