名称 | 文件后缀 | 描述 |
段文件(Segments File) | segments.gen segments_N | 存储提交点信息 |
锁文件(Lock File) | write.lock | 用来阻止多个indexWriter向同一个文件写数据 |
段信息(Segments Info) | .si | 存储段的元数据信息 |
复合文件(Compound File) | .cfs , .cfe | 一个可选的虚拟文件,包括所有其他索引文件系统频繁用完的文件句柄 |
字段信息(Fields) | .fnm | 存储字段的信息 |
字段索引(Fields Index) | .fdx | 包含指向字段值的指针 |
字段数据(Field Data) | .fdt | 存储文档里面的字段信息 |
词典(Term Dictionary) | .tim | 存储词信息 |
词索引(Term Index) | .tip | 指向词典的索引 |
频率信息(Frequencies) | .doc | 包含那些含有每一个词的频率的文档列表 |
位置信息(Positions) | .pos | 存储词在索引中出现的位置信息 |
Payloads | .pay | 额外存储每个位置的元数据信息,如字符偏移和用户负载 |
Norms | .nvd , .nvm | 文档和字段的length和boost系数的编码 |
每个文档的值(Per-Document Values) | .dvd , .dvm | 额外的得分系数或者每个文档的值信息编码 |
词向量索引(Term Vector Index) | .tvx | 存储文档的偏移数据文件 |
词向量文件(Term Vector Documents) | .tvd | 包含有词向量的文档信息 |
词向量字段(Term Vector Fields) | .tvf | 关于词向量的字段级信息 |
删除文档(Deleted Documents) | .del | 关于什么文件被删除的信息 |
转载于:https://www.cnblogs.com/chen-yu/p/3500427.html