ElasticSearch搜索引擎-2_学习笔记2021.4.18)

最新推荐文章于 2022-06-24 22:46:50 发布

懵懵懂懂程序员

最新推荐文章于 2022-06-24 22:46:50 发布

阅读量252

点赞数

分类专栏： Java 文章标签： elasticsearch java

本文链接：https://blog.csdn.net/weixin_44600430/article/details/115842274

版权

Java 专栏收录该内容

74 篇文章 3 订阅

订阅专栏

ElasticSearch搜索引擎-2_学习笔记(2021.4.18)

前言:

RESTful 介绍 , 我们通过RESTful来操作ElasticSearch (所有请求都是通过Postman )

1.0 Elasticsearch 基本操作

1.1.1 索引操作

1.1.2 创建索引 (请求方式是PUT)

对比关系型数据库，创建索引就等同于创建数据库

(同时也可以在ElasticSearch的head插件中的界面管理中创建)

在 Postman 中，向 ES 服务器发 PUT 请求：http://xxxxxxx.xx:9200/my_elasticsearch_test

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TXIDvSLQ-1618758834309)(https://z3.ax1x.com/2021/04/18/cI4Kmt.jpg)]

索引只能是小写, 并且唯一, 如果重复请求则会返回创建索引失败的错误信息

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jZeEYqbX-1618758834310)(https://z3.ax1x.com/2021/04/18/cI4Ylj.jpg)]

注意：创建索引库的分片数默认 1 片，在 7.0.0 之前的 Elasticsearch 版本中，默认 5 片, 副本数1

1.1.3 查看所有索引

在 Postman 中，向 ES 服务器发 GET 请求：http://xxxxx.xx:9200/_cat/indices?v

这里请求路径中的_cat 表示查看的意思，indices 表示索引，所以整体含义就是查看当前 ES 服务器中的所有索引

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4WEwHi4s-1618758834312)(https://z3.ax1x.com/2021/04/18/cI575T.jpg)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZVn7izSd-1618758834314)(https://z3.ax1x.com/2021/04/18/cIIce1.jpg)]

1.1.4 查看单个索引

在 Postman 中，向 ES 服务器发 GET 请求：http://xxxxx.xx:9200/my_elasticsearch_test

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0pqqEs55-1618758834314)(https://z3.ax1x.com/2021/04/18/cII5Se.jpg)]

1.1.5 删除索引

在 Postman 中，向 ES 服务器发 DELETE 请求：http://xxxxx.xx:9200/my_elasticsearch_test

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-R8vWRF6T-1618758834315)(https://z3.ax1x.com/2021/04/18/cIoZpF.jpg)]

同时可以通过插件的界面管理工具对索引进行操作

2.0 文档操作

2.1.1 创建文档

类似关系型数据库中的往表里面添加一行行数据, 添加的数据格式为 JSON 格式

在 Postman 中，向 ES 服务器发 POST 请求：http://xxxxx.xx:9200/my_elasticsearch_test/_doc

请求体内容为:

{
 "title":"文章标题",
 "content":"我是文章内容",
  "count": 0
}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N1q4WQWY-1618758834315)(https://z3.ax1x.com/2021/04/18/cI7uIx.jpg)]

此处需要注意：如果增加数据时明确数据主键，那么请求方式也可以为 PUT

2.1.2 查看文档

查看文档时，需要指明文档的唯一性标识，类似于 MySQL 中数据的主键查询

在 Postman 中，向 ES 服务器发 GET 请求：

http://xxxxx.xx:9200/my_elasticsearch_test/_search (查看当前索引所有文档)

http://xxxxx.xx:9200/my_elasticsearch_test/_doc/1 (查看当前索引单个文档)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HxLqxIUU-1618758834316)(https://z3.ax1x.com/2021/04/18/cI7WF0.jpg)]

2.1.3 修改文档

和新增文档一样，输入相同的 URL 地址请求，如果请求体变化，会将原有的数据内容覆盖

在 Postman 中，向 ES 服务器发 POST/PUT 请求：

http://xxxxx.xx:9200/my_elasticsearch_test/_doc/1 (当前索引下修改对应ID的全部字段)

http://xxxxx.xx:9200/my_elasticsearch_test/_update/1 (当前索引下修改对应ID的局部字段)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tOBKpJ9F-1618758834316)(https://z3.ax1x.com/2021/04/18/cIHY1U.jpg)]

2.1.4 删除文档

删除一个文档不会立即从磁盘上移除，它只是被标记成已删除（逻辑删除）。

在 Postman 中，向 ES 服务器发 DELETE 请求：http://xxxxx.xx:9200/my_elasticsearch_test/_doc/2 (根据主键条件删除)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aAkLNcx7-1618758834317)(https://z3.ax1x.com/2021/04/18/cIbnC6.jpg)]

条件删除文档 ( 可以所以高级查询语法做为请求体)

在 Postman 中，向 ES 服务器发 POST 请求：http://xxxxx.xx:9200/my_elasticsearch_test/_delete_by_query

请求体内容:
{
   "title": "文章标题4",
   "content": "我是修文章内容1",
   "count": 4
}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LNxlsBXQ-1618758834317)(https://z3.ax1x.com/2021/04/18/cIqJL4.jpg)]

3.0 映射操作 (对文档建立映射)

有了索引库，等于有了数据库中的 database。

接下来就需要建索引库(index)中的映射了，类似于数据库(database)中的表结构(table)。

如某个字段的数据类型、默认值、分词器、是否被索引等等，这些都是映射里面可以设置的

创建数据库表需要设置字段名称，类型，长度，约束等；

索引库也一样，需要知道这个类型下有哪些字段，每个字段有哪些约束信息，这就叫做映射(mapping)。

3.1 创建映射

在 Postman 中，向 ES 服务器发 PUT 请求：http://xxxxx.xx:9200/my_elasticsearch_test/_mapping

请求体内容为：

{
    "properties": {
        "title": {
            "type": "text",
            "index": true
        },
        "content": {
            "type": "text",
            "index": false
        },
        "count": {
            "type": "long",
            "index": false
        }
    }
}

3.2 查看创建的映射

向 ES 服务器发 GET请求：http://xxxxx.xx:9200/my_elasticsearch_test/_mapping

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pLxKRzdO-1618758834318)(https://z3.ax1x.com/2021/04/18/cIjY1x.jpg)]

3.3 进行查看文档数据 (校验是否走分词索引)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iVSN4RVe-1618758834319)(https://z3.ax1x.com/2021/04/18/cIva2q.jpg)]

高级查询扩展:

{
    "query": {
        "match": {}
    }
}

匹配查询

“query”：这里的 query 代表一个查询对象，里面可以有不同的查询属性

查询类型，例如：match_all(代表查询所有)， match，term ， range 等等

{查询条件}：查询条件会根据类型的不同，写法也有差异

match 匹配类型查询，会把查询条件进行分词，然后进行查询，多个词条之间是 or 的关系

在 Postman 中，向 ES 服务器发 GET 请求：http://xxxxx.xx:9200/my_elasticsearch_test/_search

请求体如下:

{
    "query": {
        "match": {
            "name": "zhihao"
        }
    }
}

字段匹配查询

multi_match 与 match 类似，不同的是它可以在多个字段中查询。

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "multi_match": {
            "query": "zhihao",
            "fields": [
                "name",
                "nickname"
            ]
        }
    }
}

关键字精确查询

term 查询，精确的关键词匹配查询，不对查询条件进行分词。

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "term": {
            "name": {
                "value": "zhihao"
            }
        }
    }
}

多关键字精确查询

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件，类似于 mysql 的 in

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "terms": {
            "name": [
                "zhohao",
                "laoshiji"
            ]
        }
    }
}

指定查询字段(查询返回字段)

默认情况下，Elasticsearch 在搜索的结果中，会把文档中保存在_source 的所有字段都返回。如果我们只想获取其中的部分字段，我们可以添加_source 的过滤

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "_source": [
        "name",
        "nickname"
    ],
    "query": {
        "terms": {
            "nickname": [
                "zhihao"
            ]
        }
    }
}

过滤字段

includes：来指定想要显示的字段 , excludes：来指定不想要显示的字段

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "_source": {
        "includes": [
            "name",
            "nickname"
        ]
    },
    "query": {
        ......
    }
}

组合查询

bool把各种其它查询通过must（必须）、must_not（必须不）、should（应该）的方式进行组合

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "name": "zhihao"
                    }
                }
            ],
            "must_not": [
                {
                    "match": {
                        "age": "18"
                    }
                }
            ],
            "should": [
                {
                    "match": {
                        "sex": "男"
                    }
                }
            ]
        }
    }
}

范围查询

range 查询找出那些落在指定区间内的数字或者时间。range 查询允许以下字符

gt 大于> gte 大于等于>= lt 小于< lte 小于等于<=

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "range": {
            "age": {
                "gte": 30,
                "lte": 35
            }
        }
    }
}

模糊查询

返回包含与搜索字词相似的字词的文档。

编辑距离是将一个术语转换为另一个术语所需的一个字符更改的次数。

这些更改可以包括：  更改字符（box → fox）  删除字符（black → lack）  插入字符（sic → sick）  转置两个相邻字符（act → cat）为了找到相似的术语，

fuzzy 查询会在指定的编辑距离内创建一组搜索词的所有可能的变体或扩展。

然后查询返回每个扩展的完全匹配。通过 fuzziness 修改编辑距离。一般使用默认值 AUTO，根据术语的长度生成编辑距离。

在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "fuzzy": {
            "title": {
                "value": "zhihao"
            }
        }
    }
}

单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过 order 指定排序的方式。desc 降序，asc 升序。在在 Postman 中，向 ES 服务器发上面同样 GET 请求, 请求体如下:

{
    "query": {
        "match": {
            "name": "zhihao"
        }
    },
    "sort": [
        {
            "age": {
                "order": "desc"
            }
        }
    ]
}

多字段排序

假定我们想要结合使用 age 和 _score 进行查询，并且匹配的结果首先按照年龄排序，然后按照相关性得分排序

{
    "query": {
        "match_all": {}
    },
    "sort": [
        {
            "age": {
                "order": "desc"
            }
        },
        {
            "_score": {
                "order": "desc"
            }
        }
    ]
}

高亮查询

在进行关键字搜索时，搜索出的内容中的关键字会显示不同的颜色，称之为高亮。

Elasticsearch 可以对查询内容中的关键字部分，进行标签和样式(高亮)的设置。

在使用 match 查询的同时，加上一个 highlight 属性：

 pre_tags：前置标签  post_tags：后置标签  fields：需要高亮的字段

title：这里声明 title 字段需要高亮，后面可以为这个字段设置特有配置，也可以空

在 Postman 中，向 ES 服务器发 GET 请求

{
    "query": {
        "match": {
            "name": "zhihao"
        }
    },
    "highlight": {
        "pre_tags": "<font color='red'>",
        "post_tags": "</font>",
        "fields": {
            "name": {}
        }
    }
}

分页查询

from：当前页的起始索引，默认从 0 开始。 from = (pageNum - 1) * size

size：每页显示多少条

{
    "query": {
        "match_all": {}
    },
    "sort": [
       // ....
    ],
    "from": 0,
    "size": 2
}

聚合查询

聚合允许使用者对 es 文档进行统计分析，类似与关系型数据库中的 group by，当然还有很多其他的聚合，例如取最大值、平均值等等。

// 最大
{
    "aggs": {
        "max_age": {
            "max": {
                "field": "age"
            }
        }
    },
    "size": 0
}

// 最小
{
    "aggs": {
        "min_age": {
            "min": {
                "field": "age"
            }
        }
    },
    "size": 0
}

桶聚合查询

桶聚和相当于 sql 中的 group by 语句

 terms 聚合，分组统计

{
    "aggs": {
        "age_groupby": {
            "terms": {
                "field": "age"
            }
        }
    },
    "size": 0
}

懵懵懂懂程序员

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
ElasticSearch搜索引擎-2_学习笔记2021.4.18)

ElasticSearch搜索引擎-2_学习笔记(2021.4.18)前言:RESTful 介绍 , 我们通过RESTful来操作ElasticSearch (所有请求都是通过Postman )1.0 Elasticsearch 基本操作1.1.1 索引操作1.1.2 创建索引 (请求方式是PUT)对比关系型数据库，创建索引就等同于创建数据库(同时也可以在ElasticSearch的head插件中的界面管理中创建)在 Postman 中，向 ES 服务器发 PUT 请求：http
复制链接

扫一扫