缘起于对geo filter的优化(http://blog.csdn.net/jollyjumper/article/details/23120197),当时模仿lucene的filter写了一个geo filter,其中getDocIdSet返回的时一个FixedSizeBitSet对象,在小的索引(1G)上测试出来性能比之前有明显提升,但在大的索引(23G)上反而比原来更慢。于是改成自己实现一个DocIdSetIterator,内部维护一个DocsEnum的PriorityQueue,以保证next时总是按docId升序。Lucene的filter都是用FixedSizeBitSet,在索引大的时候其实是有性能问题的。
Lucene中Filter的性能问题
最新推荐文章于 2022-08-19 09:44:28 发布