索引库维护

最新推荐文章于 2022-01-24 13:50:45 发布

学无止路

最新推荐文章于 2022-01-24 13:50:45 发布

阅读量119

点赞数

分类专栏： Lucene

本文链接：https://blog.csdn.net/weixin_40055163/article/details/109154940

版权

Lucene 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

索引库维护

1 添加文档
实现代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
/**
 * 索引库维护
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 15:45
 */
@SuppressWarnings("all")    // 注解警告信息
public class IndexManager {
    @Test
    public void testAddDocument() throws Exception {
        //创建一个IndexWriter对象，需要使用IKAnalyzer作为分析器
        IndexWriter indexWriter =
                                     new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
                                     new IndexWriterConfig(new IKAnalyzer()));
        //创建一个Document对象
        Document document = new Document();
        //向document对象中添加域
        document.add(new TextField("name", "新添加的文件", Field.Store.YES));
        document.add(new TextField("content", "新添加的文件内容", Field.Store.NO));
        document.add(new StoredField("path", "F:/temp/helo"));
        // 把文档写入索引库
        indexWriter.addDocument(document);
        //关闭索引库
        indexWriter.close();
     }
}

运行结果如图所示：在这里插入图片描述
打开Luke工具如图所示，说明添加文档成功！
点击Search搜索content:内容如图所示，三条数据。
2 删除索引库
编写删除全部文档的代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
 * 索引库维护
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 15:45
 */
@SuppressWarnings("all")    // 注解警告信息
public class IndexManager {
    // 声明IndexWriter业务对象
    private IndexWriter IndexWriter;
    @Before // init方法在Test注解方法之前运行
    public void init() throws IOException {
        //创建一个IndexWriter对象，需要使用IKAnalyzer作为分析器
        IndexWriter =
                new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
                        new IndexWriterConfig(new IKAnalyzer()));

    }
    /**
     * 删除全部文档
     * @throws Exception
     */
    @Test
    public void deleteAllDocument() throws IOException {
        //删除全部文档
        IndexWriter.deleteAll();
        //关闭索引库
        IndexWriter.close();
    }
}

运行结果如图所示：在这里插入图片描述
重新刷新Luke索引库，如图所示，说明删除成功！
测试根据查询删除索引库的代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
 * 索引库维护
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 15:45
 */
@SuppressWarnings("all")    // 注解警告信息
public class IndexManager {
    // 声明IndexWriter业务对象
    private IndexWriter IndexWriter;
    @Before // init方法在Test注解方法之前运行
    public void init() throws IOException {
        //创建一个IndexWriter对象，需要使用IKAnalyzer作为分析器
        IndexWriter =
                new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
                        new IndexWriterConfig(new IKAnalyzer()));

    }
    /**
     * 根据查询删除索引库的方法
     * @throws Exception
     */
    @Test
    public void deleteDocumentByQuery() throws Exception {
        IndexWriter.deleteDocuments(new Term("name", "apache"));
        IndexWriter.close();
    }
}

运行结果如图所示：在这里插入图片描述
声明之前删除索引库，这里需要之前创建索引库的方法。
打开Luke工具重新刷新一下，说明删除成功！
使用查询索引库查询内容为apache，运行结果如图所示，为0，说明删除成功！
3 更新索引库
测试更新索引库的代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
import java.io.IOException;
/**
 * 索引库维护
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 15:45
 */
@SuppressWarnings("all")    // 注解警告信息
public class IndexManager {
    // 声明IndexWriter业务对象
    private IndexWriter indexWriter;
    @Before // init方法在Test注解方法之前运行
    public void init() throws IOException {
        //创建一个IndexWriter对象，需要使用IKAnalyzer作为分析器
        indexWriter =
                new IndexWriter(FSDirectory.open(new File("F:\\temp\\index").toPath()),
                        new IndexWriterConfig(new IKAnalyzer()));

    }
      /**
     * 更新索引库
     * @throws Exception
     */
    @Test
    public void updateDocument() throws Exception {
        //创建一个新的文档对象
        Document document = new Document();
        //向文档对象中添加域
        document.add(new TextField("name", "更新之后的文档", Field.Store.YES));
        document.add(new TextField("name1", "更新之后的文档2", Field.Store.YES));
        document.add(new TextField("name2", "更新之后的文档3", Field.Store.YES));
        //更新操作
        indexWriter.updateDocument(new Term("name", "spring"), document);
        //关闭索引库
        indexWriter.close();
    }
}

运行结果如图所示：在这里插入图片描述
在Luke工具更新之后，如图所示，证明成功！
选择15，可以看见如图所示的结果：
更新的原则是先删除在添加。
4 数值范围查询
使用Query的子类：
1.TermQuery：根据关键字进行查询。
.需要指定要查询的域或者要查询的关键字。
2.RangeQuery：数值查询范围。
测试代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.LongPoint;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import java.io.File;
/**
 * 测试查询索引库
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 20:24
 */
@SuppressWarnings("all")    // 注解警告信息
public class SearchIndex {
    // 声明IndexReader业务对象
    private IndexReader indexReader;
    // 声明IndexSearcher业务对象
    private IndexSearcher indexSearcher;
    /**
     *初始化方法
     * @throws Exception
     */
    @Before
    public void init() throws Exception {
        indexReader = DirectoryReader.open(FSDirectory.open(new File("F:\\temp\\index").toPath()));
        indexSearcher = new IndexSearcher(indexReader);
    }
    @Test
    public void testRangeQuery() throws Exception {
        //创建一个Query对象
        Query query = LongPoint.newRangeQuery("size", 0L, 100L);
        printResult(query);
    }
    private void printResult(Query query) throws Exception {
        //执行查询
        TopDocs topDocs = indexSearcher.search(query, 10);
        System.out.println("总记录数：" + topDocs.totalHits);
        ScoreDoc[] scoreDocs = topDocs.scoreDocs;
        for (ScoreDoc doc:scoreDocs){
            //取文档id
            int docId = doc.doc;
            //根据id取文档对象
            Document document = indexSearcher.doc(docId);
            System.out.println(document.get("name"));
            System.out.println(document.get("path"));
            System.out.println(document.get("size"));
            //System.out.println(document.get("content"));
            System.out.println("-----------------寂寞的分割线");
        }
        indexReader.close();
    }
}

运行结果如图所示：在这里插入图片描述
5 进行查询
编写测试代码如下：

package com.txw.lucene;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.LongPoint;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.FSDirectory;
import org.junit.Before;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKAnalyzer;
import java.io.File;
/**
 * 测试查询索引库
 * @author：Adair
 * @QQ：1578533828
 * @date 2020-07-11 20:24
 */
@SuppressWarnings("all")    // 注解警告信息
public class SearchIndex {
    // 声明IndexReader业务对象
    private IndexReader indexReader;
    // 声明IndexSearcher业务对象
    private IndexSearcher indexSearcher;
    /**
     *初始化方法
     * @throws Exception
     */
    @Before
    public void init() throws Exception {
        indexReader = DirectoryReader.open(FSDirectory.open(new File("F:\\temp\\index").toPath()));
        indexSearcher = new IndexSearcher(indexReader);
    }
     /**
     *使用QueryParser进行查询
     * 可以对要查询的内容先分词，然后基于分词的结果进行查询。
     * @throws Exception
     */
    @Test
    public void testQueryParser() throws Exception {
        //创建一个QueryPaser对象，两个参数
        QueryParser queryParser = new QueryParser("name", new IKAnalyzer());
        //参数1：默认搜索域，参数2：分析器对象
        //使用QueryPaser对象创建一个Query对象
        Query query = queryParser.parse("lucene是一个Java开发的全文检索工具包");
        //执行查询
        printResult(query);
    }
    private void printResult(Query query) throws Exception {
        //执行查询
        TopDocs topDocs = indexSearcher.search(query, 10);
        System.out.println("总记录数：" + topDocs.totalHits);
        ScoreDoc[] scoreDocs = topDocs.scoreDocs;
        for (ScoreDoc doc:scoreDocs){
            //取文档id
            int docId = doc.doc;
            //根据id取文档对象
            Document document = indexSearcher.doc(docId);
            System.out.println(document.get("name"));
            System.out.println(document.get("path"));
            System.out.println(document.get("size"));
            //System.out.println(document.get("content"));
            System.out.println("-----------------寂寞的分割线");
        }
        indexReader.close();
    }
}

需要添加如图所示的依赖jar包，才能使用。在这里插入图片描述
运行结果如图所示：

学无止路

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
索引库维护

索引库维护1 添加文档实现代码如下：package com.txw.lucene;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.document.StoredField;import org.apache.lucene.document.TextField;import org.apache.lucene.index.In
复制链接

扫一扫