0. 备注:
搜索引擎标签
指的是我之前在网上找解决方案时用的查询关键字,但是搜索结果并不是我想要的。- Lucene 版本 8.2.0 (org.apache.lucene.util.Version#LATEST=LUCENE_8_2_0)
1. 用于删除的键需要是可索引的
搜索引擎标签:
- Lucene 删除之后还能查询到
private void write(IndexWriter indexWriter) throws Exception
{
Document doc = new Document();
// doc.add(new StoredField("id", "123456789")); // WRONG
// doc.add(new Field("id", new BytesRef("123456789"), StringField.TYPE_STORED)); // YES
doc.add(new TextField("id", "123456789", Field.Store.YES)); // YES
doc.add(new TextField("summary", "HelloWorld", Field.Store.YES));
doc.add(new TextField("title", "China No.1", Field.Store.YES));
doc.add(new StoredField("content", "This is content"));
indexWriter.addDocument(doc);
indexWriter.commit();
}
在最初,我用的 id 字段就是 StoredField 类型。
调用 public long deleteDocuments(Term... terms)
能得到一个不为0的返回结果,但是并没有成功删除,因为还能查询到。
参考链接: delete documents based on storedfield.
2. 数组类型字段的值要查询的话,参数需要是 TextField
搜索引擎标签:
- Lucene 多 Field 查询不到
private void write(IndexWriter indexWriter) throws Exception
{
Document doc = new Document();
doc.add(new TextField("id", "123456789", Field.Store.YES));
doc.add(new TextField("summary", "HelloWorld", Field.Store.YES));
doc.add(new TextField("title", "China No.1", Field.Store.YES));
doc.add(new StoredField("content", "This is content"));
String[] keywords = new String[]{"Java", "C++", "Python"};
for(String keyword : keywords) {
// doc.add(new StringField("keywords", keyword, Field.Store.NO)); // Not Found
doc.add(new TextField("keywords", keyword, Field.Store.NO));
}
indexWriter.addDocument(doc);
indexWriter.commit();
}
我存储多个 keyword
为 keywords
, 如果我keyword
将存储成 StringField
的话是查询不到的,需要存储为 TextField
。
即使我不想单个 keyword
被分词,但是现在我不知道怎么处理。