Lucene从2.9版本就提供了一个近实时搜索功能,就是在一个打开的IndexWriter中获取IndexReader,读取该IndexWriter要写入的内容。
Lucene 4.x版本对这个功能进行了一些改变。
先看代码:
Directory dir=FSDirectory.open(Paths.get("C:/lucene_index/index2"));
IndexWriterConfig config=new IndexWriterConfig(new StandardAnalyzer());
try(IndexWriter writer=new IndexWriter(dir,config)){
for(int i=0;i<10;i++){
Document doc=new Document();
doc.add(new StringField("id",i+"",Field.Store.NO));
doc.add(new StringField("text","text",Field.Store.NO));
writer.addDocument(doc);
}
IndexReader reader=DirectoryReader.open(writer);
IndexSearcher searcher=new IndexSearcher(reader);
Query query=new TermQuery(new Term("text","text"));
TopDocs topDocs=searcher.search(query, 10);
System.out.println(topDocs.totalHits);
writer.deleteDocuments(new Term("id","7"));
Document anotherDoc=new Document();
anotherDoc.add(new StringField("id","11",Field.Store.NO));
anotherDoc.add(new StringField("text","text2",Field.Store.NO));
writer.addDocument(anotherDoc);
IndexReader anotherReader=DirectoryReader.openIfChanged((DirectoryReader)reader);
System.out.println(reader==anotherReader);
searcher=new IndexSearcher(anotherReader);
topDocs=searcher.search(query, 10);
System.out.println(topDocs.totalHits);
topDocs=searcher.search(new TermQuery(new Term("text","text2")),10);
System.out.println(topDocs.totalHits);
reader.close();
anotherReader.close();
}
首先创建文档和索引,这个就不多说了。
然后调用DirectoryReader的静态方法open,传入writer对象,这样就可以获得IndexWriter内部的IndexReader,以便实时读取IndexWriter要写入的内容。
做了一系列操作之后,我需要重新读取IndexWriter已写入的内容,这时调用DirectoryReader的openInChanged方法,将reader强转后传入,这个方法类似3.x中的reader.reopen方法,这样就实现了近实时搜索,避免多次新建IndexReader耗费系统资源。