Elasticsearch如何使用模糊查询

系列文章目录

了解如何操作Elasticsearch的模糊查询



前言

实验的Elasticsearch环境为7.9


提示:以下是本篇文章正文内容,下面案例可供参考

一、模糊查询

fuzzy 查询是 term 查询的模糊等价。 也许你很少直接使用它,但是理解它是如何工作的,可以帮助你在更高级别的 match 查询中使用模糊性。

示例:

POST /my_index/my_type/_bulk
{ "index": { "_id": 1 }}
{ "text": "Surprise me!"}
{ "index": { "_id": 2 }}
{ "text": "That was surprising."}
{ "index": { "_id": 3 }}
{ "text": "I wasn't surprised."}

现在我们可以为词 surprize 运行一个 fuzzy 查询:

GET /my_index/my_type/_search
{
  "query": {
    "fuzzy": {
      "text": "surprize"
    }
  }
}

在这里插入图片描述
从上图中可以看到查询的单词为surprize,但是查询到第一条和第三条数据。这是因为fuzzy 查询是一个词项级别的查询,所以它不做任何分析。它通过某个词项以及指定的 fuzziness 查找到词典中所有的词项。 fuzziness 默认设置为 AUTO

在我们的例子中, surprize 比较 surprise 和 surprised 都在编辑距离 2 以内, 所以文档 1 和 3 匹配。

通过以下查询,我们可以减少匹配度到仅匹配 surprise :
示例2:

GET /my_index/my_type/_search
{
  "query": {
    "fuzzy": {
      "text": {
        "value": "surprize",
        "fuzziness": 1
      }
    }
  }
}

在这里插入图片描述

二、模糊匹配查询

match 查询支持开箱即用的模糊匹配:

GET /my_index/my_type/_search
{
  "query": {
    "match": {
      "text": {
        "query":     "SURPRIZE ME!",
        "fuzziness": "AUTO",
        "operator":  "and"
      }
    }
  }
}

在这里插入图片描述

查询字符串首先进行分析,会产生词项 [surprize, me] ,并且每个词项根据指定的 fuzziness 进行模糊化。
同样, multi_match 查询也支持 fuzziness ,但只有当执行查询时类型是 best_fields 或者 most_fields :

GET /my_index/my_type/_search
{
  "query": {
    "multi_match": {
      "fields":  [ "text", "title" ],
      "query":     "SURPRIZE ME!",
      "fuzziness": "AUTO"
    }
  }
}

在这里插入图片描述

match 和 multi_match 查询都支持 prefix_length 和 max_expansions 参数。


总结

主要了解在Elasticsearch中如何使用模糊查询,以及如何操作。

在这里插入图片描述

### 回答1: 在Elasticsearch中,可以使用模糊查询来查找包含与搜索术语相似的文档。Elasticsearch提供了不同类型的模糊查询: 1. 通配符查询(Wildcard Query):使用通配符匹配查询关键字中的任何字符,*代表零个或多个字符,?代表一个字符。 例如,要查找包含单词"colours"的文档,可以使用通配符查询:"colo*" 2. 正则表达式查询(Regular Expression Query):使用正则表达式匹配查询关键字中的任何字符。 例如,要查找包含单词"color"或"colour"的文档,可以使用正则表达式查询:"/colou?r/" 3. 模糊查询(Fuzzy Query):通过模糊匹配查询关键字中的单词来查找文档。模糊查询使用编辑距离算法计算相似度。 例如,要查找包含单词"color"或"colour"的文档,可以使用模糊查询:"color~1",其中1表示编辑距离为1。 4. 模糊匹配查询(Match Query with Fuzziness):与模糊查询类似,但是可以使用match查询来搜索特定字段。 例如,要在标题字段中查找包含单词"color"或"colour"的文档,可以使用模糊匹配查询:"match": { "title": { "query": "color", "fuzziness": "1" } },其中fuzziness表示编辑距离为1。 请注意,模糊查询可能会导致搜索结果的数量大大增加,因此建议使用时谨慎。 ### 回答2: Elasticsearch是一个开源的分布式搜索和分析引擎,提供强大的全文搜索功能。在Elasticsearch中,模糊查询是一种可以匹配包含部分关键词的搜索查询。 Elasticsearch模糊查询主要通过两种方式实现:通配符查询和模糊查询。 通配符查询使用通配符符号(*)来匹配任意字符或字符序列。例如,如果我们想要找到包含以"el"开头的单词,我们可以使用查询字符串"el*"进行模糊查询。这将匹配到"elastic"、"elephant"等单词。通配符查询虽然强大,但是它的性能相对较低并且不会被缓存,因此在实际使用中应该谨慎使用。 另一种模糊查询的方式是使用模糊查询语法。模糊查询可以通过添加模糊符号(~)来匹配指定相似度的单词。例如,如果我们想要找到包含类似于"elastic"的单词,我们可以使用查询字符串"elastic~"进行模糊查询模糊查询默认的相似度是0.5,如果我们想要调整相似度,可以使用~后面添加一个介于0和1之间的小数来指定。 除了以上两种方式,Elasticsearch还提供了其他一些模糊查询的功能,如正则表达式查询、模糊匹配和距离匹配等。这些功能可以根据具体的需求进行使用,提供更精确的模糊查询结果。 总而言之,Elasticsearch模糊查询功能可以通过通配符查询和模糊查询语法来实现,可以根据具体的需求选择合适的方式进行查询。模糊查询是搜索引擎中常用的一种查询方式,可以帮助用户找到包含部分关键词的相关文档。 ### 回答3: Elasticsearch是一个开源搜索引擎,具有强大的模糊查询功能。模糊查询是指在搜索过程中,允许用户进行模糊匹配,以便找到与查询条件相似的结果。 在Elasticsearch中,模糊查询可以通过使用通配符、近似匹配或模糊匹配来实现。以下是几种常见的模糊查询方法: 1. 通配符查询:可以使用通配符符号(*)表示任意字符或字符序列。例如,如果想要搜索包含"elast"开头的单词,可以使用通配符查询"elast*"。 2. 近似匹配:Elasticsearch可以使用编辑距离算法进行近似匹配。编辑距离是通过添加、删除或替换一个字符来将一个字符串转换为另一个字符串所需的最小操作次数。可以通过设置fuzziness参数来控制模糊度,从而实现近似匹配。例如,可以搜索与"elastic"相似(编辑距离为1)的单词,使用模糊查询"elastic~1"。 3. 模糊匹配:模糊匹配是一种使用模糊度来匹配查询条件的方法。可以通过设置fuzziness参数来控制模糊度的程度。例如,使用模糊查询"elastic"可以匹配到类似"eleastic"或"elasstic"的单词。 值得注意的是,模糊查询可能会导致搜索结果的准确性下降,因为它允许不严格匹配。因此,在使用模糊查询时需要权衡结果的准确性和查询的覆盖范围。 总之,Elasticsearch模糊查询功能可以通过通配符、近似匹配和模糊匹配来实现。这些功能可以灵活地满足用户对模糊查询的需求,并在搜索过程中提供更好的匹配和相关性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值