Elasticsearch7.X 打卡学习(随缘更新。。)

最新推荐文章于 2022-03-23 20:19:21 发布

想要追着光

最新推荐文章于 2022-03-23 20:19:21 发布

阅读量195

点赞数

分类专栏： ElasticSearch 文章标签： elasticsearch

本文链接：https://blog.csdn.net/wantLight/article/details/108513406

版权

本文介绍了Elasticsearch7.X的主要概念，包括索引、映射、文档、字段、集群、节点、分片和副本。讲解了Elasticsearch7.0的重大改进，如废弃多type支持、取消_all字段、新增应用程序主动监测功能等。深入探讨了ES的数据写入和读取过程，以及倒排索引原理。还讨论了深度分页的三种方式：from+size、scroll和search_after，强调了它们的适用场景和效率问题。

摘要由CSDN通过智能技术生成

ElasticSearch概念

索引(index)

类似的数据放在一个索引，非类似的数据放不同索引，一个索引也可以理解成一个关系型数据库。

映射(mapping)

mapping定义了每个字段的类型等信息。相当于关系型数据库中的表结构。
常用数据类型：text、keyword、number、array、range、boolean、date、geo_point、ip、nested、object

text：默认会进行分词，支持模糊查询（5.x之后版本string类型已废弃，请大家使用text）。
keyword：不进行分词；keyword类型默认开启doc_values来加速聚合排序操作，占用了大量磁盘io 如非必须可以禁用doc_values。
number：如果只有过滤场景用不到range查询的话，使用keyword性能更佳，另外数字类型的doc_values比字符串更容易压缩。
array：es不需要显示定义数组类型，只需要在插入数据时用’[]‘表示即可，’[]'中的元素类型需保持一致。
range：对数据的范围进行索引；目前支持 number range、date range 、ip range。
boolean: 只接受true、false 也可以是字符串类型的“true”、“false”
date：支持毫秒、根据指定的format解析对应的日期格式，内部以long类型存储。
geo_point：存储经纬度数据对。
ip：将ip数据存储在这种数据类型中，方便后期对ip字段的模糊与范围查询。
nested：嵌套类型，一种特殊的object类型，存储object数组，可检索内部子项。
object：嵌套类型，不支持数组。