ES基础知识介绍

microsoft_love

已于 2024-06-13 15:41:57 修改

阅读量1k

点赞数 2

分类专栏： ES 文章标签： elasticsearch java 数据结构架构

于 2023-02-23 19:34:43 首次发布

本文链接：https://blog.csdn.net/microsoft_love/article/details/129188441

版权

ES 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.术语

index（索引）

索引就像关系数据库中的表。它有一个映射，用于定义索引中的字段。

索引是一个逻辑命名空间，它映射到一个或多个主分片，并且可以有零个或更多个副本分片。

document（文档）

文档是存储在ES中的JSON文档。它就像关系数据库中表中的一行。每个文档都存储在一个索引中，并具有一个类型和一个id。

文档是一个JSON对象（在其他语言中也称为哈希/哈希映射/关联数组），它包含零个或多个字段或键值对。

id (文档唯一标识)

文档的ID标识文档。文档的索引/类型/id必须唯一。如果未提供ID，则将自动生成。

field（文档字段）

文档包含字段列表或键值对。该值可以是简单的值（例如字符串、整数、日期），也可以是嵌套结构，如数组或对象。字段类似于关系数据库中表中的列。

每个字段的映射都有一个字段类型（不要与文档类型混淆），它指示可以存储在该字段中的数据类型，例如整数、字符串、对象。映射还允许您定义（除其他外）如何分析字段的值。

mapping（映射）

映射类似于关系数据库中的表结构定义。每个索引都有一个映射，该映射定义了索引中的每个字段类型。

映射既可以显式定义，也可以在为文档编制索引时自动生成。

primary shard（主分片）

每个文档都存储在一个主分片中。当您对文档进行索引时，它首先在主分片上进行索引，然后在主分片的所有副本上进行索引。

默认情况下，索引有5个主分片。您可以指定更少或更多的主分片来缩放索引可以处理的文档数量。

创建索引后，不能更改索引中主分片的数量。

replica shard（副本分片）

每个主分片可以有零个或多个副本。副本是主分片的副本，有两个目的：

增加故障转移：如果主分片发生故障，副本分片可以升级为主分片

提高性能：get和搜索请求可以由主分片或副本分片处理。

默认情况下，每个主分片都有一个副本，但副本的数量可以在现有索引上动态更改。副本分片永远不会在与其主分片相同的节点上启动。

node

节点是属于集群的弹性搜索的运行实例。出于测试目的，可以在一台服务器上启动多个节点，但通常每个服务器应该有一个节点。

启动时，节点将使用单播来发现具有相同群集名称的现有群集，并尝试加入该群集。

node角色

1、master node

资源要求：中高CPU；中高内存；中低磁盘

一般在生产环境中配置3台

一个集群只有1台活跃的主节点，负责分片管理，索引创建，集群管理等操作

整个集群的管理者，索引管理，分片管理，以及整个集群的状态的管理，master节点是从master候选节点中选出的，成为master候选节点的方式：

2、data node

数据节点保存数据并执行数据相关操作，如CRUD、搜索和聚合。

资源要求：CPU、内存、磁盘要求都高

3、Coordinating node 协调节点

向集群添加太多的仅协调节点会增加整个集群的负担，因为所选的主节点必须等待来自每个节点的集群状态更新确认！仅协调节点的好处不应夸大 — 数据节点可以愉快地服务于相同的目的。

协调节点，所有节点都可以接受来自客户端的请求进行转发，因为每个节点都知道集群的所有索引分片的分布情况，但是别的节点，都还肩负着别的工作，如果请求压力过大，可能会拖垮整个集群的响应速度，所以就专门有了这个协调节点，他什么都不用做，只处理请求和请求结果，所以成为coordinating node的方式：