elasticsearch基本使用

最新推荐文章于 2024-07-25 10:59:09 发布

万码无虫

最新推荐文章于 2024-07-25 10:59:09 发布

阅读量62

点赞数

文章标签： elasticsearch restful

本文链接：https://blog.csdn.net/qq_45578181/article/details/119968476

版权

简介

ElasticSearch

Elasticsearch是一个分布式的RESTful风格的搜索和数据分析引擎。有以下优点：

Restful风格，一切API都遵循Rest原则，容易上手
近实时搜索，数据更新在Elasticsearch中几乎是完全同步的。

Kibana

Kibana是一个基于Node.js的Elasticsearch索引库数据统计工具
可以利用Elasticsearch的聚合功能，生成各种图表，如柱形图，线状图，饼图等。
而且还提供了操作Elasticsearch索引数据的控制台，并且提供了一定的API提示，非常有利于我们学习Elasticsearch的语法

安装

问题与解决

刚开始安装的elasticsearch与kibana都是6.3.0.但是elasticsearch出现闪退的问题。
按照网上的解决办法修改了一些配置还是不行，就把elasticsearch换成了7.14.0。
闪退问题解决了，但是登录到kibana之后提示版本问题。
再次查询发现在windows下使用kibana，与elasticsearch的版本保持一致。
于是又重新安装kibana到7.14.0版本。

使用

基本概念

数据库：索引库
类型：表格
列：字段
行：文档
映射配置：是否索引、是否存储、字段数据类型等。
【注意】：elasticsearch默认对数据进行分片和副本操作，添加数据的时候自动进行负载均衡。
Elasticsearch在创建文档索引时，会将文档中的原始数据备份，保存到一个叫做_source的属性中。而且我们可以通过storage过滤_source来选择哪些要备份。

索引

创建索引

请求方式：PUT
请求路径：/索引库名
请求参数：json格式

  {
        "settings": {
            "number_of_shards": 3,
            "number_of_replicas": 2
          }
    }

settings：索引库的设置
number_of_shards：分片数量
number_of_replicas：副本数量

查询索引

GET /索引库名

删除索引

DELETE /索引库名

映射配置

添加数据之前必须定义映射。

创建映射字段

PUT /索引库名/_mapping/类型名称
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true，
      "store": true，
      "analyzer": "分词器"
    }
  }
}

properties：相当于表名。类型名称。
字段名：相当于列名，有多个。
type：类型，可以是text、long、short、date、integer、object等
index：是否索引，默认为true
store：是否存储，默认为false
analyzer：分词器，这里的ik_max_word即使用ik分词器

type

String类型，又分两种：
text：可分词，不可参与聚合
keyword：不可分词，数据会作为完整字段进行匹配，可以参与聚合
Numerical：数值类型，分两类
基本数据类型：long、interger、short、byte、double、float、half_float
浮点数的高精度类型：scaled_float
需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。
Date：日期类型
elasticsearch可以对日期格式化为字符串存储，但是建议存储为毫秒值，存储为long，节省空间。

新增数据

Elasticsearch非常智能，你不需要给索引库设置任何mapping映射，它也可以根据你输入的数据来判断类型，动态添加数据映射。
在这里插入图片描述

修改数据

把新增的请求方式改为PUT，就是修改了。

id对应文档存在，则修改

id对应文档不存在，则新增

删除数据

删除使用DELETE请求，同样，需要根据id进行删除。

查询数据

查询所有

query：代表查询对象
match_all：代表查询所有
在这里插入图片描述

took：查询花费时间，单位是毫秒
time_out：是否超时
_shards：分片信息
hits：搜索结果总览对象
total：搜索到的总条数
max_score：所有结果中文档得分的最高分
- - hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息
    _index：索引库
    _type：文档类型
    _id：文档id
    _score：文档得分
    _source：文档的源数据

匹配查询

多个词条之间是or的关系，我们可以修改成and
match 查询支持 minimum_should_match 最小匹配参数，可以指定必须匹配的词项数用来表示一个文档是否相关。可以将其设置为某个具体数字，更常用的做法是将其设置为一个百分数，因为无法控制用户搜索时输入的单词数量：

GET /leyou/_search
{
    "query":{
        "match":{
            "title":{
            	"query":"小米曲面电视",
            	 //and匹配 "operator": "and"
            	//半匹配 "minimum_should_match": "75%"
            }
        }
    }
}

本例中，搜索语句可以分为3个词，如果使用and关系，需要同时满足3个词才会被搜索到。这里我们采用最小品牌数：75%，那么也就是说只要匹配到总词条数量的75%即可，这里3*75% 约等于2。所以只要包含2个词条就算满足条件了。

多字段查询

multi_match与match类似，不同的是它可以在多个字段中查询
GET /leyou/_search


```bash
{
    "query":{
        "multi_match": {
            "query":    "小米",
            "fields":   [ "title", "subTitle" ]
        }
	}
}

精确匹配

term 查询被用于精确值匹配，这些精确值可能是数字、时间、布尔或者那些未分词的字符串
###

多词条精确匹配

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。
在这里插入图片描述

布尔查询

bool把各种其它查询通过must（与）、must_not（非）、should（或）的方式进行组合
在这里插入图片描述

模糊查询

fuzzy 查询是 term 查询的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差，默认偏差的编辑距离不得超过2。也可以修改
在这里插入图片描述

范围查询

range 查询找出那些落在指定区间内的数字或者时间
在这里插入图片描述 range查询允许以下字符：
操作符说明
gt ：大于
gte：大于等于
lt：小于
lte：小于等于

查询过滤

如果查询结果只想获取其中的部分字段，可以添加_source的过滤

直接指定

在这里插入图片描述

包含与不包含

在这里插入图片描述
includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

非条件过滤

条件查询中进行过滤注意：filter中还可以再次进行bool组合条件过滤。

查询

单字段排序

sort 可以按照不同的字段进行排序，并且通过order指定排序的方式
在这里插入图片描述

多字段排序

结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序
在这里插入图片描述

聚合

桶

桶的作用，是按照某种方式对数据进行分组，每一组数据在ES中称为一个桶

度量

分组完成以后，我们一般会对组中的数据进行聚合运算，例如求平均值、最大、最小、求和等。

使用

【注意】在ES中，需要进行聚合、排序、过滤的字段其处理方式比较特殊，因此不能被分词。

聚合为桶

按照汽车的颜色color来划分桶

GET /cars/_search
{
    "size" : 0,
    "aggs" : { 
        "popular_colors" : { 
            "terms" : { 
              "field" : "color"
            }
        }
    }
}