ES 搜索6 (匹配查询)

最新推荐文章于 2024-05-22 17:05:31 发布

qq_42383787

最新推荐文章于 2024-05-22 17:05:31 发布

阅读量974

点赞数

分类专栏： ES 文章标签： ES 搜索6 (匹配查询)

本文链接：https://blog.csdn.net/qq_42383787/article/details/99678211

版权

ES 专栏收录该内容

31 篇文章 4 订阅

订阅专栏

匹配查询

匹配查询 match 是个核心查询。无论需要查询什么字段， match 查询都应该会是首选的查询方式。它是一个高级 全文查询 ，这表示它既能处理全文字段，又能处理精确字段。

这就是说， match 查询主要的应用场景就是进行全文搜索，我们以下面一个简单例子来说明全文搜索是如何工作的：

单个词查询

我们用第一个示例来解释使用 match 查询搜索全文字段中的单个词：

GET /my_index/my_type/_search
{
    "query": {
        "match": {
            "title": "QUICK!"
        }
    }
}

Elasticsearch 执行上面这个 match 查询的步骤是：

检查字段类型 。

标题 title 字段是一个 string 类型（ analyzed ）已分析的全文字段，这意味着查询字符串本身也应该被分析。
分析查询字符串 。

将查询的字符串 QUICK! 传入标准分析器中，输出的结果是单个项 quick 。因为只有一个单词项，所以 match 查询执行的是单个底层 term 查询。
查找匹配文档 。

用 term 查询在倒排索引中查找 quick 然后获取一组包含该项的文档，本例的结果是文档：1、2 和 3 。
为每个文档评分 。

用 term 查询计算每个文档相关度评分 _score ，这是种将词频（term frequency，即词 quick在相关文档的 title 字段中出现的频率）和反向文档频率（inverse document frequency，即词 quick 在所有文档的 title 字段中出现的频率），以及字段的长度（即字段越短相关度越高）相结合的计算方式。参见相关性的介绍。

这个过程给我们以下（经缩减）结果：

"hits": [
 {
    "_id":      "1",
    "_score":   0.5,   1
    "_source": {
       "title": "The quick brown fox"
    }
 },
 {
    "_id":      "3",
    "_score":   0.44194174,   2
    "_source": {
       "title": "The quick brown fox jumps over the quick dog"
    }
 },
 {
    "_id":      "2",
    "_score":   0.3125,    3
    "_source": {
       "title": "The quick brown fox jumps over the lazy dog"
    }
 }
]

1 文档 1 最相关，因为它的 title 字段更短，即 quick 占据内容的一大部分。

2 文档 3 比文档 2 更具相关性，因为在文档 3 中 quick 出现了两次。

qq_42383787

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ES 搜索6 (匹配查询)

匹配查询匹配查询match是个核心查询。无论需要查询什么字段，match查询都应该会是首选的查询方式。它是一个高级全文查询，这表示它既能处理全文字段，又能处理精确字段。这就是说，match查询主要的应用场景就是进行全文搜索，我们以下面一个简单例子来说明全文搜索是如何工作的：单个词查询我们用第一个示例来解释使用match查询搜索全文字段中的单个词：...
复制链接

扫一扫