Lucene索引文件

如何产生一个segment?
当IndexWriter执行commit时,会产生一个segment。

下述文件每个segment一个:
.fnm:存储一个segment中Field个数,Field名称,Field的属性(是否索引、存储etc)

.fdt:存储一个segment中,每个document中所有Field的域号、Field属性(是否分词、是否二进制、是否压缩etc),Field中存储的值

.fdx:存储一个segment中,每个document在.fdt中的偏移

.tvx, .tvd, .tvf存储了从Index->Document->Filed->Term的正向信息。
.tvf:存储一个segment中的所有Field,对每个Field,保存了Field中的所有Term信息,包含Term的文本、频率、位置、偏移量信息
.tvd:存储了一个segment中的每个Document的所有域在.tvf中的偏移量
.tvx:存储了一个segment中Document在.tvd中的偏移量以及第一个Field在.tvf中的偏移量
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值