索引库维护
1 添加文档
实现代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
/**
* 索引库维护
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 15:45
*/
@SuppressWarnings("all") // 注解警告信息
public class IndexManager {
@Test
public void testAddDocument() throws Exception {
//创建一个IndexWriter对象,需要使用IKAnalyzer作为分析器
IndexWriter indexWriter =
new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
new IndexWriterConfig(new IKAnalyzer()));
//创建一个Document对象
Document document = new Document();
//向document对象中添加域
document.add(new TextField("name", "新添加的文件", Field.Store.YES));
document.add(new TextField("content", "新添加的文件内容", Field.Store.NO));
document.add(new StoredField("path", "F:/temp/helo"));
// 把文档写入索引库
indexWriter.addDocument(document);
//关闭索引库
indexWriter.close();
}
}
运行结果如图所示:
打开Luke工具如图所示,说明添加文档成功!
点击Search搜索content:内容如图所示,三条数据。
2 删除索引库
编写删除全部文档的代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
* 索引库维护
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 15:45
*/
@SuppressWarnings("all") // 注解警告信息
public class IndexManager {
// 声明IndexWriter业务对象
private IndexWriter IndexWriter;
@Before // init方法在Test注解方法之前运行
public void init() throws IOException {
//创建一个IndexWriter对象,需要使用IKAnalyzer作为分析器
IndexWriter =
new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
new IndexWriterConfig(new IKAnalyzer()));
}
/**
* 删除全部文档
* @throws Exception
*/
@Test
public void deleteAllDocument() throws IOException {
//删除全部文档
IndexWriter.deleteAll();
//关闭索引库
IndexWriter.close();
}
}
运行结果如图所示:
重新刷新Luke索引库,如图所示,说明删除成功!
测试根据查询删除索引库的代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
* 索引库维护
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 15:45
*/
@SuppressWarnings("all") // 注解警告信息
public class IndexManager {
// 声明IndexWriter业务对象
private IndexWriter IndexWriter;
@Before // init方法在Test注解方法之前运行
public void init() throws IOException {
//创建一个IndexWriter对象,需要使用IKAnalyzer作为分析器
IndexWriter =
new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
new IndexWriterConfig(new IKAnalyzer()));
}
/**
* 根据查询删除索引库的方法
* @throws Exception
*/
@Test
public void deleteDocumentByQuery() throws Exception {
IndexWriter.deleteDocuments(new Term("name", "apache"));
IndexWriter.close();
}
}
运行结果如图所示:
声明之前删除索引库,这里需要之前创建索引库的方法。
打开Luke工具重新刷新一下,说明删除成功!
使用查询索引库查询内容为apache,运行结果如图所示,为0,说明删除成功!
3 更新索引库
测试更新索引库的代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
* 索引库维护
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 15:45
*/
@SuppressWarnings("all") // 注解警告信息
public class IndexManager {
// 声明IndexWriter业务对象
private IndexWriter indexWriter;
@Before // init方法在Test注解方法之前运行
public void init() throws IOException {
//创建一个IndexWriter对象,需要使用IKAnalyzer作为分析器
indexWriter =
new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
new IndexWriterConfig(new IKAnalyzer()));
}
/**
* 更新索引库
* @throws Exception
*/
@Test
public void updateDocument() throws Exception {
//创建一个新的文档对象
Document document = new Document();
//向文档对象中添加域
document.add(new TextField("name", "更新之后的文档", Field.Store.YES));
document.add(new TextField("name1", "更新之后的文档2", Field.Store.YES));
document.add(new TextField("name2", "更新之后的文档3", Field.Store.YES));
//更新操作
indexWriter.updateDocument(new Term("name", "spring"), document);
//关闭索引库
indexWriter.close();
}
}
运行结果如图所示:
在Luke工具更新之后,如图所示,证明成功!
选择15,可以看见如图所示的结果:
更新的原则是先删除在添加。
4 数值范围查询
使用Query的子类:
1.TermQuery: 根据关键字进行查询。
.需要指定要查询的域或者要查询的关键字。
2.RangeQuery:数值查询范围。
测试代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.LongPoint;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import java.io.File;
/**
* 测试查询索引库
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 20:24
*/
@SuppressWarnings("all") // 注解警告信息
public class SearchIndex {
// 声明IndexReader业务对象
private IndexReader indexReader;
// 声明IndexSearcher业务对象
private IndexSearcher indexSearcher;
/**
*初始化方法
* @throws Exception
*/
@Before
public void init() throws Exception {
indexReader = DirectoryReader.open(FSDirectory.open(new File("F:\\temp\\index").toPath()));
indexSearcher = new IndexSearcher(indexReader);
}
@Test
public void testRangeQuery() throws Exception {
//创建一个Query对象
Query query = LongPoint.newRangeQuery("size", 0L, 100L);
printResult(query);
}
private void printResult(Query query) throws Exception {
//执行查询
TopDocs topDocs = indexSearcher.search(query, 10);
System.out.println("总记录数:" + topDocs.totalHits);
ScoreDoc[] scoreDocs = topDocs.scoreDocs;
for (ScoreDoc doc:scoreDocs){
//取文档id
int docId = doc.doc;
//根据id取文档对象
Document document = indexSearcher.doc(docId);
System.out.println(document.get("name"));
System.out.println(document.get("path"));
System.out.println(document.get("size"));
//System.out.println(document.get("content"));
System.out.println("-----------------寂寞的分割线");
}
indexReader.close();
}
}
运行结果如图所示:
5 进行查询
编写测试代码如下:
package com.txw.lucene;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.LongPoint;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
/**
* 测试查询索引库
* @author:Adair
* @QQ:1578533828
* @date 2020-07-11 20:24
*/
@SuppressWarnings("all") // 注解警告信息
public class SearchIndex {
// 声明IndexReader业务对象
private IndexReader indexReader;
// 声明IndexSearcher业务对象
private IndexSearcher indexSearcher;
/**
*初始化方法
* @throws Exception
*/
@Before
public void init() throws Exception {
indexReader = DirectoryReader.open(FSDirectory.open(new File("F:\\temp\\index").toPath()));
indexSearcher = new IndexSearcher(indexReader);
}
/**
*使用QueryParser进行查询
* 可以对要查询的内容先分词,然后基于分词的结果进行查询。
* @throws Exception
*/
@Test
public void testQueryParser() throws Exception {
//创建一个QueryPaser对象,两个参数
QueryParser queryParser = new QueryParser("name", new IKAnalyzer());
//参数1:默认搜索域,参数2:分析器对象
//使用QueryPaser对象创建一个Query对象
Query query = queryParser.parse("lucene是一个Java开发的全文检索工具包");
//执行查询
printResult(query);
}
private void printResult(Query query) throws Exception {
//执行查询
TopDocs topDocs = indexSearcher.search(query, 10);
System.out.println("总记录数:" + topDocs.totalHits);
ScoreDoc[] scoreDocs = topDocs.scoreDocs;
for (ScoreDoc doc:scoreDocs){
//取文档id
int docId = doc.doc;
//根据id取文档对象
Document document = indexSearcher.doc(docId);
System.out.println(document.get("name"));
System.out.println(document.get("path"));
System.out.println(document.get("size"));
//System.out.println(document.get("content"));
System.out.println("-----------------寂寞的分割线");
}
indexReader.close();
}
}
需要添加如图所示的依赖jar包,才能使用。
运行结果如图所示: