Lucene中IndexSearcher类的初始化

最新推荐文章于 2023-02-12 16:01:02 发布

amw_demon

最新推荐文章于 2023-02-12 16:01:02 发布

阅读量2.7k

点赞数

分类专栏： lucene 文章标签： lucene path java file 存储

本文链接：https://blog.csdn.net/amw_demon/article/details/1535362

版权

lucene 专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了Lucene中IndexSearcher的构造函数及使用方法，特别关注了索引对象(IndexReader)的管理和资源释放问题。对于大型索引文件（超过10GB），文章提出了一种有效的解决方案来避免内存溢出问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lucene中IndexSearcher的构造函数有以下几个:

/** Creates a searcher searching the index in the named directory. */

public IndexSearcher(String path) throws IOException {

this(IndexReader.open(path), true);

}

/** Creates a searcher searching the index in the provided directory. */

public IndexSearcher(Directory directory) throws IOException {

this(IndexReader.open(directory), true);

}

/** Creates a searcher searching the provided index. */

public IndexSearcher(IndexReader r) {

this(r, false);

}

private IndexSearcher(IndexReader r, boolean closeReader) {

reader = r;

this.closeReader = closeReader;

}

由此可知，可以用索引文件的存储路径path、文件对象file、索引对象(即IndexReader对象)reader初始化IndexSearcher对象，从上边的代码可以看到前两个构造函数的参数（path或directory）都转换为索引对象，同时多了一个boolean类型的参数closeReader，那么这个增加的参数的作用是什么呢？那么我们可以在IndexSearcher类中搜索，可以看到：

/**

* Note that the underlying IndexReader is not closed, if

* IndexSearcher was constructed with IndexSearcher(IndexReader r).

* If the IndexReader was supplied implicitly by specifying a directory, then

* the IndexReader gets closed.

public void close() throws IOException {

if(closeReader)

reader.close();

}

可以看到注释中写到：注意，如果 IndexSearcher 对象由 IndexSearcher(IndexReader r) 初始化，下边的索引（ IndexReader ）对象不关闭。若如果索引（ IndexReader ）对象由一个指定的路径暗中生成，那么 IndexReader 对象将关闭。

索引（ IndexReader ）对象在搜索之前就已定义，这个索引对象不属于 IndexSearcher 对象，索引（ IndexReader ）对象就不能关闭。

在 lucene 应用中也许很多人都遇到这种情况。当索引太大（大于 10G ），搜索时用前两种构造方法声明 IndexSearcher 对象，这样每构造一个 IndexSearcher 对象，都要声明一个索引对象（实际上是一个索引的多次连接），而每个索引对象都要占用一定量的系统资源（主要是内存）。当大量用户访问系统时，就会看到系统内容直线增长，致使产生“ java heap space ”内存耗尽。这个问题可以通过以下方法解决：