Elasticsearch 搜索的过程？

最新推荐文章于 2024-08-07 10:14:22 发布

爱编程的小白L

最新推荐文章于 2024-08-07 10:14:22 发布

阅读量474

点赞数 13

分类专栏： Java零基础学习 Java面试集文章标签： elasticsearch 大数据搜索引擎

本文链接：https://blog.csdn.net/qq_54276699/article/details/135473388

版权

Java面试集同时被 2 个专栏收录

72 篇文章 1 订阅

订阅专栏

Java零基础学习

48 篇文章 3 订阅

订阅专栏

Elasticsearch 是一个开源的分布式搜索和分析引擎，它基于 Apache Lucene 构建而成。下面是 Elasticsearch 搜索的基本过程：

索引文档（Indexing Documents）：
- 数据首先被组织成文档（Documents），文档包含一个或多个字段（Fields）。
- 文档被存储在一个索引（Index）中，索引是文档的逻辑容器。
倒排索引（Inverted Index）：
- Elasticsearch 使用倒排索引的数据结构，它将每个唯一的词汇（terms）映射到包含该词汇的文档列表。
- 倒排索引提供了快速的词汇查询能力。
搜索请求（Search Request）：
- 用户通过发送搜索请求来查询数据。
- 搜索请求包括查询语句、过滤条件、排序规则等信息。
Query 解析（Query Parsing）：
- Elasticsearch 解析查询语句，将其转换为内部数据结构，这个过程涉及将用户输入的查询转化为一系列的词汇和操作。
执行查询（Query Execution）：
- Elasticsearch 使用倒排索引来执行查询，找到匹配查询条件的文档。
- 查询可以包括全文搜索、精确匹配、范围过滤等多种条件。
评分（Scoring）：
- 检索到的文档按照匹配度进行评分，得分高的文档排在前面。
- Elasticsearch 使用 TF-IDF（Term Frequency-Inverse Document Frequency）等算法来计算文档的得分。
返回结果（Return Results）：
- 检索到的文档按照得分排序后返回给用户。
- 结果可能包含文档的部分或全部内容，取决于用户的查询和需求。
聚合（Aggregation）：
- Elasticsearch 还支持对搜索结果进行聚合操作，可以对结果集进行统计、分组、计算平均值等操作。