lucene4.5源码分析系列：索引缓存以及刷新

最新推荐文章于 2023-04-12 08:23:22 发布

liweisnake

最新推荐文章于 2023-04-12 08:23:22 发布

阅读量4.1k

点赞数

分类专栏： lucene源码系列文章标签： 4.5 源码 lucene 缓存刷新

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liweisnake/article/details/11659799

版权

缓存和刷新是比较重要的问题，它涉及到lucene如何管理内存和磁盘。前面提到索引的结果是缓存在内存中的，等到一定时候才会将其刷新到硬盘上去。缓存在这里的目的无非是缓解高速设备到低速设备的不匹配。下面这些问题都比较重要：调用增删改索引后此时索引时已经写入磁盘还是仍然驻留内存，即索引的刷新时间是什么？其次，缓存会占用多少内存？另外，刷新的效率如何？最后，lucene允许多个线程并发刷新索引，具体实现是怎么做的？

flush的一个总入口是DocumentWriter中的doFlush，随后严格按照索引链层层向下传递，直到FreqProxTermWriter的flush方法，FreqProxTermWriter中最后会调用如下语句，将所有对索引文件的操作交给codec去做。

state.segmentInfo.getCodec().postingsFormat().fieldsConsumer(state).write(fields);

那么到底哪些地方会调用flush呢？实际上，下面这5个地方都会最终调用到flush，可以发现，这5个地方已经涵盖了对索引的大部分操作，可见flush的重要。

从源码上看，addIndexes, forceMerge, close和commit4个操作都是进行full flush，入口为DocumentWriter.flushAllThreads，他们会对所有active的DocumentsWriterPerThread进行flush；而updateDocument则只会flush一个DocumentsWriterPerThread。

在lucene中，flush是由DocumentsWriterFlushControl来统一控制的，好处就是统一入口ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
lucene4.5源码分析系列：索引缓存以及刷新

缓存以及刷新
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。