es中match_phrase和term区别

文章目录

term是将传入的文本原封不动地(不分词)拿去查询。
match会对输入进行分词处理后再去查询,部分命中的结果也会按照评分由高到低显示出来。
match_phrase是按短语查询,只有存在这个短语的文档才会被显示出来。

也就是说,term和match_phrase都可以用于精确匹配,而match用于模糊匹配。

之前我以为match_phrase不会被分词,看来理解错了,其官方解释如下:

Like the match query, the match_phrase query first analyzes the query string to produce a list of terms. It then searches for all the terms, but keeps only documents that contain all of the search terms, in the same positions relative to each other.

总结下,这段话的3个要点:

  1. match_phrase还是分词后去搜的
  2. 目标文档需要包含分词后的所有词
  3. 目标文档还要保持这些词的相对顺序和文档中的一致

只有当这三个条件满足,才会命中文档!

那么,term和match_phrase都可以实现按短语搜索,二者在实际使用中有啥区别呢。

【发现问题】
1.我们先放入一个文档:
在这里插入图片描述

2.然后使用match_phrase搜索:

在这里插入图片描述

嗯,不出所料,搜索到了。

3.然后我们用term试试
在这里插入图片描述
纳尼!!!居然没有?那么全句带进去搜总行了吧
在这里插入图片描述
在这里插入图片描述
居然还是不行!!这就奇怪了。

【问题分析】我们来看看这句话的分词结果:

在这里插入图片描述
在这里插入图片描述
我们会发现,中文竟然被默认分词器分词单个字了!尴尬啊!!!
这就不难理解为啥term搜“学习”搜不到,搜全文也搜不到,因为存的是“学”和“习”。

【总结】如果使用term查询,要确保字段是no analyzed的。建索引的时候要注意。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你遇到的问题可能是由于Elasticsearch的分析器配置不正确导致的。当使用match_phrase查询时,默认情况下,Elasticsearch会应用分析器来对查询字符串进行分词处理,然后再与索引的文本进行匹配。对于文文本,分析器可能会将文本按照字或词进行分词,而对于数字和英文文本,可能会按照空格或标点符号进行分词。这就导致了在使用match_phrase查询时无法准确匹配数字和英文。 要解决这个问题,你可以考虑以下几种方法: 1. 明确指定要匹配的字段的分析器:你可以通过显式地指定要匹配的字段的分析器,确保分析器适用于数字和英文文本。例如,可以使用keyword分析器来保持字段的原始内容不变。 2. 自定义分析器:你可以创建自定义分析器,根据你的需求对数字和英文文本进行适当的分词处理。可以使用字符过滤器、分词器和标记过滤器等组件来定义自定义分析器。 3. 使用term查询:如果你希望精确匹配数字和英文文本,可以考虑使用term查询而不是match_phrase查询。term查询不会应用分析器,直接将查询字符串与索引的词条进行精确匹配。 请注意,在使用以上方法时,还需要确保索引的字段映射与你的需求相匹配,例如字段类型、分析器等设置。此外,还可以考虑使用其他查询类型,如match查询或query_string查询,根据具体情况选择合适的查询方式。 希望这些信息能帮助你解决问题!如有更多疑问,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值