ReaderPool类对于理解Lucene的一些机制起到了极其关键的作用,这些机制至少包含段的合并、作用(apply)删除信息、NRT(near real-time)、flush/commit与merge的并发过程中的删除信息的处理等等,所以有必要单独用一篇文章来介绍这个类。下面先给出源码中对于这个类的介绍:
图1:
图1的javadoc中这样描述ReaderPool类:该类持有一个或多个SegmentReader对象的引用,并且是shared SegmentReader,share描述的是在flush阶段、合并阶段、NRT等不同的场景中都共用ReaderPool对象中的SegmentReader。另外IndexWriter还会使用这些shared SegmentReaders来实现例如作用(apply)删除信息、执行段的合并、NRT搜索。
构造ReaderPool对象
ReaderPool对象只在构造IndexWriter对象期间生成,正如图1中的Javadoc所描述的那样,它用来被IndexWriter使用。
图2:
我们通过ReaderPool的构造函数来介绍在构造ReaderPool对象期间一些主要的内容:
图3:
我们看下图3中红框标注的部分内容,它描述的是通过参数StandardDirectoryReader reader,从中依次读取它包含的SegmentReader,然后将每个SegmentReader的信息存储到代码第93行的readerMap中。
构造函数的参数StandardDirectoryReader reader是哪里来的?
通过图2的流程点获取IndexCommit对应的StandardDirectoryReader
获得StandardDirectoryReader,在随后流程点生成对象ReaderPool
中传递给ReaderPool的构造函数。
代码第93行的readerMap是什么?
readerMap是一个map容器,它是ReaderPool对象的实例变量。其中key为SegmentCommitInfo对象,value为ReadersAndUpdates对象,如下所示:
看这里:https://www.amazingkoala.com.cn/Lucene/Index/2020/1208/183.html