ElasticSearch实现子串查询

最新推荐文章于 2022-10-22 17:27:55 发布

阳光&洒落

最新推荐文章于 2022-10-22 17:27:55 发布

阅读量1.6k

点赞数

文章标签： elasticsearch 搜索引擎 lucene

本文链接：https://blog.csdn.net/zhou1308173549/article/details/122199228

版权

match查询和term查询

match能够实现对查询字符串的模糊匹配，term实现对查询内容的精准匹配，通常可以用来处理数字（numbers）、布尔值（booleans）、日期（dates）以及文本（text）

精准查找价格为20的文档：

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "filter": [
                {
                    "term": {
                        "price": 20
                    }
                }
            ]
        }
    }
}

实现子串的查询query_string

为了避免match执行时会将查询字符串进行分词、以及term完全匹配的特点，我们可以使用query_string语法来实现子串的查询，示例代码如下：

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "query_string": {
                        "default_field": "table_name",
                        "query": "\"student_info\""
                    }
                }
            ]
        }
    }
}

query_string的查询块中指定了两个属性：default_field 指定要查询的字段，query 指定要查询的子串。上述代码的功能就是实现查找table_name字段中包含"student_info"字符串的文档。注意query字段中字符串的表示形式，需要显示的用双引号扩起来，才不会进行分词

想到这里就猜想，在match匹配时，将查询字符串显示的用双引号扩起来是不是也可以避免分词，答案是否定的。示例代码如下：

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "table_name": {
                            "query": "\"student_info\""
                        }
                    }
                }
            ]
        }
    }
}

返回的查询结果显示仍然对query字符串进行了分词匹配，和直接使用不带双引号的查询字符串结果是一样的。

精准搜索字符串怎么破

为什么用term精准搜索字符串会失效，示例代码如下：

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "table_name": {
                            "value": "student_info"
                        }
                    }
                }
            ]
        }
    }
}

我们期望能搜索出table_name为"student_info"的文档，但是却没有返回结果。原因是在建立索引的时候，会对text类型的字段进行分词，然后建立索引，所以table_name字段的倒排索引中是不包含完整的"student_info"这个信息的。

如果要实现对text类型字段的精准匹配，在建立_mapping的时候就要指定：index：not_analyzed。告诉ElasticSearch该字段具有精确值，禁止对该字段的内容进行分词。同样也就失去了模糊匹配的能力

阳光&洒落

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
ElasticSearch实现子串查询

这里写自定义目录标题我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：
复制链接

扫一扫