转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/42836309
前面我们已经介绍了非结构数据的检索过程以及lucene的数学模型,这篇博客就主要介绍一下lucene索引的文件结构,下图是lucene生成的索引实例:
lucene索引结构是层次结构,主要有以下几个层次:
索引(Index)
在lucene中,一个索引是放在一个文件夹中的,上述实例中的所有文件就组成了lucene索引
段(Segment)
一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能会生成新段,不同的段可以合并生成一个新段,上图中相同的前缀文件就属于同一个段(图中共有两个段 _0 和 _1),当段的个数达到一定数量,段与段直接会合并,生成新段;segments.gen和segment_2既是段的元数据文件,也保存了段的属性信息。
<