Elasticsearch常用命令汇总

Elasticsearch常用命令汇总

1. Elasticsearch中的数据格式

img

ES里的 Index 可以看做一个库,而 Types 相当于表,Documents 则相当于表的行。这里 Types 的概念已经被逐渐弱化,Elasticsearch 6.X 中,一个 index 下已经只能包含一个 type,Elasticsearch 7.X 中, Type 的概念已经被删除了。

2. 索引操作

2.1 查看所有索引

在 Postman 中,向 ES 服务器发 GET 请求。

· health 当前服务器健康状态:green(集群完整) yellow(单点正常、集群不完整) red(单点不正常)

· status 索引打开、关闭状态

· index 索引名

· uuid 索引统一编号

· pri 主分片数量

· rep 副本数量

· docs.count 可用文档数量

· docs.deleted 文档删除状态(逻辑删除)

· store.size 主分片和副分片整体占空间大小

· pri.store.size 主分片占空间大小

GET http://IP:Port/_cat/indices?v

2.2 创建索引

在ES中创建一个索引,就相当于在mysql中创建了一个数据库,而mysql中的数据库肯定是不能重复的,也即ES中的索引也不能重复,所以这是一个幂等性操作,需要发送PUT请求(如果重复发送PUT请求、重复添加索引,会返回错误信息),这里不能发送POST请求。

PUT http://IP:Port/索引名
示例: http://127.0.0.1:9301/test.api_info

入参示例

{
    "mappings": {
        "properties": {
            "apiId": {
                "type": "keyword"
            },
            "apiNameCn": {
                "type": "text",
                "fields": {
                    "keyword": {
                        "type": "keyword",
                        "ignore_above": 100
                    }
                },
                "analyzer": "my_analyzer"
            },
            "apiNameEn": {
                "type": "text",
                "fields": {
                    "keyword": {
                        "type": "keyword",
                        "ignore_above": 100
                    }
                },
                "analyzer": "my_analyzer"
            }
        }
    }
}

2.3 查看指定索引

GET http://IP:Port/test.api_info

2.4 查询索引下字段映射信息

GET http://IP:Port/test.api_info/_mapping

返回信息和【创建索引】入参内容一致

2.5 复制索引

POST http://IP:Port/_reindex

入参示例

{
    "source": {
        "index": "test.api_info"
    },
    "dest": {
        "index": "test.api_info-back",
        "type": "_doc"
        
    }
}

2.6 重命名索引

POST http://IP:Port/_aliases

入参示例

{
  "actions": [
    {
      "add": {
        "index": "test.api_info-back",
        "alias": "test.api_info"
      }
    }
  ]
}

2.7 删除索引

DELETE http://IP:Port/test.api_info

3. 文档操作

3.1 创建文档

索引已经创建好了,接下来我们来创建文档,并添加数据。这里的文档可以类比为关系型数据库中的表数据,添加的数据格式为 JSON 格式。

POST http://IP:Port/test.api_info/_doc

入参示例

{
  "apiId":"5b33947e4ffa11ef90045a163ed26690",
  "apiNameCn":"字典列表查询",
  "apiNameEn":"dictQuery",
  "num": 300
}

上面的数据创建后,由于没有指定数据唯一性标识(ID),默认情况下,ES 服务器会随机生成一个。

如果想要自定义唯一性标识,需要在创建时指定。推荐使用下面这种方式创建文档。

POST http://IP:Port/test.api_info/_doc/1001

3.2 查看单个文档:主键查询

查看文档时,需要指明文档的唯一性标识,类似于 MySQL 中数据的主键查询。在 Postman 中,向 ES 服务器发 GET 请求。

GET http://IP:Port/test.api_info/_doc/1001

3.3 查看所有文档:全查询

“query”:这里的 query 代表一个查询对象,里面可以有不同的查询属性
“match_all”:查询类型,例如:match_all(代表查询所有), match,term , range 等等
{查询条件}:查询条件会根据类型的不同,写法也有差异

GET http://IP:Port/test.api_info/_search

3.4 修改文档中的全部字段

修改数据时,也可以只修改某一给条数据的局部信息,也可以修改所有字段信息。

修完完之后,再次发送GET请求,查看修改后的文档内容。

3.4.1 修改请求
PUT http://IP:Port/test.api_info/_doc/1001

入参示例

{
  "apiId":"5b33947e4ffa11ef90045a163ed26690",
  "apiNameCn":"字典列表查询",
  "apiNameEn":"dictQueryList"
}
3.4.2 查询请求
GET http://IP:Port/test.api_info/_doc/1001

3.5 修改文档中的某个字段

POST http://IP:Port/test.api_info/_update/1001

入参示例

{
    "doc" : {
       "apiNameCn":"字典查询",
    }
}

3.6 删除文档

删除一个文档不会立即从磁盘上移除,它只是被标记成已删除(逻辑删除)。

DELETE http://IP:Port/test.api_info/_doc/1001

3.7 条件查询文档内容

match匹配类型查询,会把查询条件进行分词,然后进行查询,多个词条之间是 or 的关系。


3.7.1 条件查询-参数在请求路径后面
  1. 使用这个查询字段为下划线的貌似不生效,如:api_name_cn。
  2. 这种查询方式的请求参数是直接跟在请求路径之后的,这种方式不太好,因为有可能造成乱码问题,不建议使用。
GET http://IP:Port/test.api_info/_search?q=apiNameCn:字典
3.7.2 条件查询-参数在请求体中
GET http://IP:Port/test.api_info/_search

入参示例

{
    "query" : {
        "match" : {
            "apiNameCn" : "字典"
        }
    }
}

3.8 分页查询 + 排序文档内容

默认情况下,Elasticsearch 在搜索的结果中,会把文档中保存在_source 的所有字段都返回。如果我们只想获取其中的部分字段,我们可以添加_source 的过滤

sort:可以让我们按照不同的字段进行排序,并且通过 order 指定排序的方式。desc 降序,asc 升序。

from:当前页的起始索引,默认从 0 开始。 from = (pageNum - 1) * size。

size:每页显示多少条。

GET http://IP:Port/test.api_info/_search

入参示例

{
    "query" : {
        "match_all" : {
 
        }
    },
    "from" : 0, // (页码-1)*每页条数, 第一页:(1-1)*2=0, 第二页:(2-1)*2=2
    "size" : 2,
    "_source" : ["apiNameCn","apiNameEn"],
    "sort" : {
        "apiNameCn" : {
            "order" : "desc"
        }
    }
}

3.9 多条件查询:must、must_not、should

bool把各种其它查询通过must(必须 and )、must_not(必须不)、should(应该 or)的方式进行组合 。

GET http://IP:Port/test.api_info/_search

入参示例

{
	"query" : {
		"bool" : {
			"must" : [
				{
					"match" : {
						"apiNameCn" : "字典"
					}
				},
				{
					"match" : {
						"apiNameEn" : "dict"
					}
				}
			]
		}
	}
}

3.10 多条件查询:大于、小于

range查询找出那些落在指定区间内的数字或者时间。range 查询允许以下字符:
gt 大于> gte 大于等于>= lt 小于< lte 小于等于<=

GET http://IP:Port/test.api_info/_search

入参示例

{
	"query" : {
		"bool" : {
			"must" : [
				{
					"match" : {
						"apiNameCn" : "字典"
					}
				}
			],
			"filter" : {
				"range" : {
					"num" : {
						"gt" : 30,
                        "lt" : 40`
					}
				}
			}
		}
	}
}

3.11 全文查询 + 高亮显示

在进行关键字搜索时,搜索出的内容中的关键字会显示不同的颜色,称之为高亮。

在使用 match 查询的同时,加上一个 highlight 属性:

· pre_tags:前置标签

· post_tags:后置标签

· fields:需要高亮的字段

· title:这里声明 title 字段需要高亮,后面可以为这个字段设置特有配置,也可以空

GET http://IP:Port/test.api_info/_search

入参示例

{
    "query" : {
        "match_phrase" : {
            "apiNameCn" : "字列"
        }
    },
    "highlight" : {
        "fields" : {
            "apiNameCn" : {}
        }
    }
}

match_phrase是短语搜索,亦即它会将给定的短语(phrase)当成一个完整的查询条件。当使用match_phrase进行搜索的时候,你的结果集中,所有的Document都必须包含你指定的查询词组,在这里是“字列”。这看起来有点像关系型数据库的like查询操作。假如说,不想采用全文检索的匹配模式,可以将 match 改为 match_phrase。

3.12 聚合查询:根据数据分组、对数量求平均值

聚合允许使用者对 es 文档进行统计分析,类似与关系型数据库中的 group by,当然还有很多其他的聚合,例如取最大值、平均值等等。

· 对某个字段取最大值 max

· 对某个字段取最小值 min

· 对某个字段求和 sum

· 对某个字段取平均值 avg

· 对某个字段的值进行去重之后再取总数 distinct

3.12.1 聚合查询-分组
GET http://IP:Port/test.api_info/_search

入参示例

{
    "aggs" : { //聚合操作
        "name_group" : { //名称,自定义
            "terms" : { //分组
                "field" : "apiNameCn" //分组字段
            }
        }
    },
    "size" : 0
}
3.12.2 聚合查询-平均值
GET http://IP:Port/test.api_info/_search

入参示例

{
    "aggs" : { //聚合操作
        "num_avg" : { //名称,自定义
            "avg" : { //分组
                "field" : "num" //分组字段
            }
        }
    },
    "size" : 0
}

4. 映射操作

有了索引库,等于有了数据库中的 database。接下来就需要建索引库(index)中的映射了,类似于数据库(database)中的表结构(table)。创建数据库表需要设置字段名称,类型,长度,约束等;索引库也一样,需要知道这个类型下有哪些字段,每个字段有哪些约束信息,这就叫做映射(mapping)。

映射数据说明

  • 字段名:任意填写,下面指定许多属性,例如:title、subtitle、images、price
  • type:类型,Elasticsearch 中支持的数据类型非常丰富,说几个关键的:
    String 类型,又分两种:
    text:可分词
    keyword:不可分词,数据会作为完整字段进行匹配
    Numerical:数值类型,分两类
    基本数据类型:long、integer、short、byte、double、float、half_float
    浮点数的高精度类型:scaled_float
    Date:日期类型
    Array:数组类型
    Object:对象
  • index:是否索引,默认为 true,也就是说你不进行任何配置,所有字段都会被索引。
    true:字段会被索引,则可以用来进行搜索
    false:字段不会被索引,不能用来搜索
  • store:是否将数据进行独立存储,默认为 false
    原始的文本会存储在_source 里面,默认情况下其他提取出来的字段都不是独立存储的,是从_source 里面提取出来的。当然你也可以独立的存储某个字段,只要设置"store": true 即可,获取独立存储的字段要比从_source 中解析快得多,但是也会占用更多的空间,所以要根据实际业务需求来设置
  • analyzer:分词器,这里的 ik_max_word 即使用 ik 分词器

首先是http://127.0.0.1:9200/user ,发送PUT请求,创建一个user索引,然后在这个索引下创建一个映射。

就类似于在mysql中创建一个名为 user 的数据库,在这个数据库中定义一张表的结构如下:

text类型为true表示 name 字段可以支持 分词、拆解 操作的查询;而 keyword 类型为true表示 sex 字段仅支持完全匹配的模式;最后 keyword 类型为false表示 tel 字段不支持查询。

PUT http://127.0.0.1:9200/user

入参

{
	"properties" : {
		"name" : {
			"type" : "text",
			"index" : true
		},
		"sex" : {
			"type" : "keyword",
			"index" : true
		},
		"tel" : {
			"type" : "keyword",
			"index" : false
		}
	}
}

img

索引有了,映射也有了(数据库有了、表结构有了,就差向表中添加数据了),也就是需要添加文档内容。

img

因为name字段是 支持 text 模式查询,即支持 分词、拆解 操作,做倒排索引,所以虽然文档中的name字段为张起灵,但是经过分词拆解,name为 张、起、灵、起灵 这几种都可以查询出数据。

img

由于 sex 字段不支持text分词拆解,仅支持keyword完全匹配的模式,所以源文档数据中 sex 为 man,这里只写个 m 是查询不到的。

img

最后的 tel 字段是最苛刻的,压根不支持 text、keyword 两种查询模式,所以这里就算是写成和文档中的 tel 一样,也查询不到,因为 tel 字段不支持查询。

img

参考文档

Elasticsearch——创建/查看/删除索引、创建/查看/修改/删除文档、映射关系

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值