基于lucene的案例开发:索引文件结构

本文详细介绍了Lucene的索引结构,包括索引、段、文档、域和词等概念,以及正向信息和反向信息的保存。通过分析文件结构,展示了如何从索引到词的层次关系,并提及了不同版本Lucene的文件结构变化。
摘要由CSDN通过智能技术生成

转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/42836309

      前面我们已经介绍了非结构数据的检索过程以及lucene的数学模型,这篇博客就主要介绍一下lucene索引的文件结构,下图是lucene生成的索引实例:


       lucene索引结构是层次结构,主要有以下几个层次:

索引(Index)

在lucene中,一个索引是放在一个文件夹中的,上述实例中的所有文件就组成了lucene索引

段(Segment)

一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能会生成新段,不同的段可以合并生成一个新段,上图中相同的前缀文件就属于同一个段(图中共有两个段  _0 和 _1),当段的个数达到一定数量,段与段直接会合并,生成新段;segments.gen和segment_2既是段的元数据文件,也保存了段的属性信息。

<

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值