lucene 4.6 之indexing 之 IndexChain，索引数据结构

最新推荐文章于 2022-06-26 21:48:48 发布

犀利-sharp

最新推荐文章于 2022-06-26 21:48:48 发布

阅读量328

点赞数

分类专栏： lucene 源码 index index chain DocConsumer

本文链接：https://blog.csdn.net/fcc7619666/article/details/52022163

版权

lucene 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

源码

3 篇文章 0 订阅

订阅专栏

DocConsumer

2 篇文章 0 订阅

订阅专栏

      /*
      This is the current indexing chain:

      DocConsumer / DocConsumerPerThread
        --> code: DocFieldProcessor
          --> DocFieldConsumer / DocFieldConsumerPerField
            --> code: DocFieldConsumers / DocFieldConsumersPerField
              --> code: DocInverter / DocInverterPerField
                --> InvertedDocConsumer / InvertedDocConsumerPerField
                  --> code: TermsHash / TermsHashPerField
                    --> TermsHashConsumer / TermsHashConsumerPerField
                      --> code: FreqProxTermsWriter / FreqProxTermsWriterPerField
                      --> code: TermVectorsTermsWriter / TermVectorsTermsWriterPerField
                --> InvertedDocEndConsumer / InvertedDocConsumerPerField
                  --> code: NormsConsumer / NormsConsumerPerField
          --> StoredFieldsConsumer
            --> TwoStoredFieldConsumers
              -> code: StoredFieldsProcessor
              -> code: DocValuesProcessor
    */

DocumentsWriterPerThread 中具体负责索引工作的是IndexingChain，这些类跟持久化到磁盘上得索引文件都存在对应关系。

DocFieldProcessor 继承DocConsumer ，负责收集所有的field的信息，然后传给相应的per-field consumers , 来处理这些信息，具体的事情由他的成员变量,真正干实事的是：

NormsConsumer：写 _X.nrm 文件，写归一化的文件。

FreqProxTermsWriter：写_X.tim,_X.tip, _X.doc, _X.pos文件。

TermsVectorConsumer：写_X.tvx ,_X.tvd, _X.tvf 文件。

StoredFieldsProcessor：写_X.fnm, _X.fdt,_X.fdx 文件。

在DocFieldProcessor中，用一个DocFieldProcessorPerField[]的数组来保存每一个field对应的处理对象，因为每一个对象都是复用的。

Lucene_原理与代码分析完整版.pdf (5.2 MB)
下载次数: 8

犀利-sharp

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lucene 4.6 之indexing 之 IndexChain，索引数据结构

/* This is the current indexing chain: DocConsumer / DocConsumerPerThread --> code: DocFieldProcessor --> DocFieldConsumer / DocFieldConsumerPerField -
复制链接

扫一扫