ElasticSearch 学习10 短语匹配查询 match_phrase

你好龙卷风！！！

已于 2024-02-19 15:07:36 修改

阅读量2.1k

点赞数

分类专栏： elasticsearch 文章标签： elasticsearch 学习大数据

于 2024-02-19 11:44:07 首次发布

原文链接：https://blog.csdn.net/qq_42764468/article/details/130079356

版权

elasticsearch 专栏收录该内容

10 篇文章 3 订阅

订阅专栏

Elasticsearch 的查询方式主要包括以下几种：



Match Query（匹配查询）：这是最基本的查询方式，根据字段中的内容进行全文匹配查询，
可以使用match、multi_match等。1
Term Query（精确查询）：根据字段中的精确值进行查询，适用于keyword类型或者已经执行过分词器的字段。

Range Query（范围查询）：根据字段中的范围值进行查询，可以用来查询数字或日期范围，例如大于、小于、范围内等。

Bool Query（布尔查询）：通过逻辑运算符（must、must_not、should）组合多个查询条件，实现更复杂的查询逻辑。

Match Phrase Query（短语匹配查询）：根据字段中连续的短语进行查询，适用于需要保持短语顺序的查询。

Prefix Query（前缀查询）：根据字段中的前缀进行查询，适用于需要按照前缀匹配查询的场景。

Wildcard Query（通配符查询）：根据通配符模式进行查询，支持通配符符号（*和?）进行模糊匹配。

Fuzzy Query（模糊查询）：根据字段中的模糊匹配进行查询，可以通过设置fuzziness参数来控制模糊程度。

Nested Query（嵌套查询）：根据嵌套对象进行查询，以便查询嵌套在文档中的相关信息。

Aggregation Query（聚合查询）：用于计算、统计和分析数据，包括求和、平均值、最小值、最大值、分组等操作。

此外，还有其他一些查询方式，如Dis_max 查询、function_score 查询、geospatial 查询等

短语匹配查询 match_phrase

1. ElasticSearch match_phrase查询是什么？它与match查询有什么区别？

match_phrase查询是一种用于匹配短语的查询方式，可以用于精确匹配多个单词组成的短语。它会将查询字符串分解成单词，然后按照顺序匹配文档中的单词，只有当文档中的单词顺序与查询字符串中的单词顺序完全一致时才会匹配成功。

与match查询不同，match查询只需要匹配查询中的一个或多个单词，而不需要考虑单词的顺序。例如，如果查询是“quick brown fox”，match查询将匹配包含“quick”、“brown”或“fox”的文档，而不管它们的顺序如何。相比之下，match_phrase查询只会匹配包含完全短语“quick brown fox”的文档。

因此，match_phrase查询更适合需要精确匹配短语的情况，而match查询更适合需要模糊匹配单词的情况。

2. ElasticSearch match_phrase 查询的语法是什么？

{
  "query": {
    "match_phrase": {
      "field_name": "query_string"
    }
  }
}

其中，field_name表示要匹配的字段名，query_string表示要匹配的查询字符串。

3. ElasticSearch match_phrase 查询的参数有哪些？

ElasticSearch的match_phrase查询参数如下：

query：需要匹配的短语。
slop：允许短语中的单词之间的最大距离。默认为0，表示必须按照给定的顺序精确匹配。
analyzer：指定用于分析查询字符串的分析器。
boost：为查询设置权重，以控制查询结果的相关性得分。
minimum_should_match：指定应该匹配的最小术语数。

例如，以下是一个使用match_phrase查询的示例：

{
  "query": {
    "match_phrase": {
      "title": {
        "query": "Elasticsearch 中文",
        "slop": 2
      }
    }
  }
}

这个查询将匹配包含“Elasticsearch”和“中文”这两个词的文档，但是这两个词之间的最大距离不能超过2个单词。

4. ElasticSearch multi_match 短语匹配查询

① 构造数据：

PUT /my_index
{
  "mappings": {
    "properties": {
      "title":{
        "type": "text"
      },
      "content":{
        "type": "text"
      }
    }
  }
}

PUT /my_index/_doc/1
{
  "title": "文雅酒店",
  "content": "Beijing City"
}

PUT /my_index/_doc/2
{
  "title": "文雅精品酒店",
  "content": "Huaibei City"
}


PUT /my_index/_doc/3
{
  "title": "文雅超级精品酒店",
  "content": "Qingdao City"
}

② 假设在酒店标题中搜索“文雅酒店”，希望酒店标题中的“文雅”与“酒店”紧邻并且“文雅”在“酒店”前面，使用短语精确匹配查询：

GET /my_index/_search
{
  "query": {
    "match_phrase": {
      "title": "文雅酒店"
    }
  }
}

可以看到只有 title 字段中包含 ”文雅酒店“ 的文档被查询到了：

{
  "took" : 76,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.6184612,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.6184612,
        "_source" : {
          "title" : "文雅酒店",
          "content" : "Beijing City"
        }
      }
    ]
  }
}

③ 如果想要 title 字段包含 ”文雅精品酒店“ 的文档也被查询到，则可以设置 match_phrase 查询的 slop 参数，它用来调节匹配词之间的距离阈值，默认为0，表示必须按照给定的顺序精确匹配。如下查询将匹配包含“文雅”和“酒店”这两个词的文档，但是这两个词之间的最大距离不能超过2个单词。

GET /my_index/_search
{
  "query": {
    "match_phrase": {
      "title": {
        "query": "文雅酒店",
        "slop": 2
      }
    }
  }
}

{
  "took" : 25,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 0.6184612,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.6184612,
        "_source" : {
          "title" : "文雅酒店",
          "content" : "Beijing City"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.25545135,
        "_source" : {
          "title" : "文雅精品酒店",
          "content" : "Huaibei City"
        }
      }
    ]
  }
}

④ 如果想要 title 字段包含 ”文雅超级精品酒店“ 的文档也被查询到，则slop可以设为4：

GET /my_index/_search
{
  "query": {
    "match_phrase": {
      "title": {
        "query": "文雅酒店",
        "slop": 4
      }
    }
  }
}

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 0.6184612,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.6184612,
        "_source" : {
          "title" : "文雅酒店",
          "content" : "Beijing City"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.25545135,
        "_source" : {
          "title" : "文雅精品酒店",
          "content" : "Huaibei City"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 0.13824427,
        "_source" : {
          "title" : "文雅超级精品酒店",
          "content" : "Qingdao City"
        }
      }
    ]
  }
}

5. SpringBoot整合ES实现 multi_phrase 查询

GET /my_index/_search
{
  "query": {
    "match_phrase": {
      "title": {
        "query": "文雅酒店",
        "slop": 4
      }
    }
  }
}

@Slf4j
@Service
public class ElasticSearchImpl {

    @Autowired
    private RestHighLevelClient restHighLevelClient;

    public void searchUser() throws IOException {
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();

        MatchPhraseQueryBuilder matchPhraseQueryBuilder = QueryBuilders.matchPhraseQuery("title", "文雅酒店");
        matchPhraseQueryBuilder.slop(4);
        searchSourceBuilder.query(matchPhraseQueryBuilder);

        SearchRequest searchRequest = new SearchRequest(new String[]{"my_index"},searchSourceBuilder);
        SearchResponse searchResponse = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
        System.out.println(searchResponse);
    }
}

你好龙卷风！！！

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
ElasticSearch 学习10 短语匹配查询 match_phrase

例如，如果查询是“quick brown fox”，match查询将匹配包含“quick”、“brown”或“fox”的文档，而不管它们的顺序如何。③ 如果想要 title 字段包含 ”文雅精品酒店“ 的文档也被查询到，则可以设置 match_phrase 查询的 slop 参数，它用来调节匹配词之间的距离阈值，默认为0，表示必须按照给定的顺序精确匹配。它会将查询字符串分解成单词，然后按照顺序匹配文档中的单词，只有当文档中的单词顺序与查询字符串中的单词顺序完全一致时才会匹配成功。
复制链接

扫一扫

专栏目录