[Lucene]搜索引擎简介

最新推荐文章于 2024-02-28 19:14:03 发布

Jia的博客

最新推荐文章于 2024-02-28 19:14:03 发布

阅读量1.2k

点赞数 2

分类专栏：搜索引擎文章标签：搜索引擎搜索 Java Lucene Sole

本文链接：https://blog.csdn.net/Konaji/article/details/81412849

版权

前言搜索引擎指的是通过一定的策略, 从互联网中获取到数据, 将这些数据保存到自己的服务器当中, 然后提供用户一个页面, 用来做查询的, 这个就被称为搜索引擎例如: 百度、谷歌原始数据库查询的弊端1) 当数据量很大的时候, 当用户输入一个内容的时候, 我们很难在很快的时间进行返回2) 原始的数据库中模糊查询, 只能进行首尾的匹配3) 当用户输入错误, 那么原始的数据库将会和用户...

摘要由CSDN通过智能技术生成

前言

搜索引擎指的是通过一定的策略, 从互联网中获取到数据, 将这些数据保存到自己的服务器当中, 然后提供用户一个页面, 用来做查询的, 这个就被称为搜索引擎例如: 百度、谷歌

原始数据库查询的弊端

1) 当数据量很大的时候, 当用户输入一个内容的时候, 我们很难在很快的时间进行返回
2) 原始的数据库中模糊查询, 只能进行首尾的匹配
3) 当用户输入错误, 那么原始的数据库将会和用户的基本需求相差太远

倒排索引

倒排索引, 指定的将一句话,或者是一段话进行分词, 然后将分词的后的内容保存到索引库当中, 建立索引, 这样当用户输入一些内容的时候, 将用户输入的内容进行分词, 将分词后的数据到索引库中进行匹配, 如果有对应的数据将其对应的内容进行返回

Lucene 入门

引入pom相关jar

<!--lucene 的核心包-->
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-core</artifactId>
    <version>4.10.2</version>
</dependency>
<!--lucene 的查询依赖包(可以省略)-->
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-queries</artifactId>
    <version>4.10.2</version>
</dependency>
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-test-framework</artifactId>
    <version>4.10.2</version>
</dependency>

<!--lucene的分词器的包-->
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-analyzers-common</artifactId>
    <version>4.10.2</version>
</dependency>
<!--lucene的查询包-->
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-queryparser</artifactId>
    <version>4.10.2</version>
</dependency>
<!--lucene的高亮的包-->
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-highlighter</artifactId>
    <version>4.10.2</version>
</dependency>
<!-- 引入IK分词器 -->
<dependency>
    <groupId>com.janeluo</groupId>
    <artifactId>ikanalyzer</artifactId>
    <version>2012_u6</version>
</dependency>

下面来执行一个简单的写入案例

public static</

最低0.47元/天解锁文章

Jia的博客

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
[Lucene]搜索引擎简介

前言搜索引擎指的是通过一定的策略, 从互联网中获取到数据, 将这些数据保存到自己的服务器当中, 然后提供用户一个页面, 用来做查询的, 这个就被称为搜索引擎例如: 百度、谷歌原始数据库查询的弊端1) 当数据量很大的时候, 当用户输入一个内容的时候, 我们很难在很快的时间进行返回2) 原始的数据库中模糊查询, 只能进行首尾的匹配3) 当用户输入错误, 那么原始的数据库将会和用户...
复制链接

扫一扫

专栏目录