Hibernate Search

最新推荐文章于 2023-08-22 13:14:18 发布

XingKong22star

最新推荐文章于 2023-08-22 13:14:18 发布

阅读量857

点赞数

分类专栏： Architecture & Design 文章标签： hibernate 搜索索引全文检索 lucene

本文链接：https://blog.csdn.net/XingKong22star/article/details/45501987

版权

Hibernate Search是Hibernate的一个子项目，它引入了全文检索功能，使得开发者可以通过简单的配置实现数据库的全文搜索。该框架基于Lucene，允许透明地配置全文检索接口。当数据库中的数据变化时，Hibernate Search会自动更新检索文件，保持与数据库同步。要启用Hibernate Search，需在Maven配置文件中添加依赖，并在Hibernate配置文件中进行相应设置。

摘要由CSDN通过智能技术生成

Hibernate Search

Hibernate Search是Hibernate的子项目，把数据库全文检索能力引入到项目中，并通过"透明"(不影响既有系统)的配置，提供一套标准的全文检索接口。

全文检索的概念

在进入正文之前，有必要介绍一下全文检索的概念。简单来说，Google就是一个全文检索引擎。全文检索允许用户输入一些关键字，从数据层中查找到所需要的信息。此外全文检索和数据库"LIKE"语句相比，没有数据库开销或是数据库的开销非常小，因为检索过程全部从通过检索文件完成，因此效率非常高。此外，全文检索引擎可以提供的还远不止"LIKE"语句这么多。在全文检索领域，用户输入的搜索信息叫做关键字，而全文检索系统把海量信息按照这些关键字进行结构化处理，把文章打散成段落、文字，最后，按关键字对文章的数据进行分类。这个处理后的数据文本叫做检索文件，检索文件往往比实际数据小得多，但它的数据所包含的信息量损失却非常小。当用户输入一个关键字时，全文检索引擎可以很快地定位到相关文本。

什么是Lucene

Lucene是一个开源的全文检索引擎，目前已经成为了Apache基金会赞助项目。Lucene是Java社区非常流行的全文检索引擎，功能强大。它不仅可以检索一般的数据文本，还可以检索PDF、HTML及微软的Word文件等。此外，Lucene成功的原因之一是它开放的框架，几乎框架的每一部分都可以扩展。它的文本分析器可以定制，检索文件存储方式可以定制，查询引擎也有不同的可选方案，如果愿意，还可以自已定制。此外，它提供一套非常强大的API接口，使客户用起来很方便。此外，Lucene除支持非结构化检索\footnote{用户输入一个关键字，全文检索引擎去匹配任何字段包含该关键字的数据条目。}外，还支持结构化检索(用户可以指定具体搜索的model类、字段名以及搜索条件)。这章的重点不是Lucene，但做为Hibernate Search的核心，您有必要对它的基本概念有所了解。下面介绍一些Lucene中的基本概念：

Document：在Lucene中，一个Document即一个搜索单元。举例来说：如果对一个用户表做检索，那么每条用户信息就是一个Document。
Field：每一个Document都包含一或多个Field，每一个Field都是key-value数据对。
Analyzer：分析器/断字器。这是全文检索引擎的心脏，如何将一篇文章打散成一些关键字，并能够不丢失信息量，这是一门单独的学科。Lucene提供多种Analyzer，并提供开放的接口让社区的专家提供新的Analyzer。
Index：系统生成的检索信息，这里面存储了Document。
IndexSearcher：IndexSearcher负责检索Index内容负责给出检索结果。
IndexWriter：IndexWriter负责调用Analyzer，分析后生成Index。