Lucene实战 ——(一)初识Lucene

Lucene介绍

Lucene的定位是,核心索引和搜索的模块,并非完整的搜索程序。

本章思维导图

搜索程序的组件

在这里插入图片描述
其中阴影部分的可以由Lucene完成。

索引组件

为何需要索引操作?

假设有一个3GB大小的文本,需要找出“程序”两个字,一种最简单的方式是顺序扫描,但这种扫描明显效率很低。所以就要选中一种高效的数据结构来存储,使得查询速度达到最快,这个过程就叫做索引操作,它的输出就叫索引

索引的流程

在这里插入图片描述

搜索组件

搜索质量

在这里插入图片描述

搜索的流程

在这里插入图片描述

索引过程核心类

在这里插入图片描述

搜索过程核心类

在这里插入图片描述

实例程序

创建索引

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.Directory;

import java.io.File;
import java.io.FileFilter;
import java.io.IOException;
import java.io.FileReader;
import java.nio.file.Paths;

public class IndexTest {
   

    //索引写入对象
    private IndexWriter writer;


    public static void main(String[] args) throws Exception {
   

        String rootPath = "/searchengine/surfbird-search";
        String indexDir = rootPath + "/index";         //1 指定目录创建索引
        String dataDir = rootPath + "/data";          //2 对指定目录中的*.txt文件进行索引

        long start = System.currentTimeMillis();
        IndexTest indexer = new IndexTest(indexDir);
        int numIndexed;
        
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值