ES（五）| 集群搭建、集群脑裂问题、分布式存储和查询、集群故障转移

慌途L

已于 2024-04-26 10:28:48 修改

阅读量522

点赞数

分类专栏： ElasticSearch 文章标签： elasticsearch 分布式集群脑裂问题集群故障转移

于 2022-08-25 20:30:00 首次发布

本文链接：https://blog.csdn.net/qq_25112523/article/details/126484332

版权

ElasticSearch 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

ES（五）| 集群搭建、集群脑裂问题、分布式存储和查询、集群故障转移

ES集群

上一篇：ES（四）| 数据聚合（分组、求和、求平均值、求最大最小值）

ES集群

单机的elasticsearch做数据存储，必然面临两个问题：海量数据存储问题、单点故障问题。

海量数据存储问题：将索引库从逻辑上拆分为N个分片（shard），存储到多个节点
单点故障问题：将分片数据在不同节点备份（replica）

ES集群相关概念:

集群（cluster）：一组拥有共同的cluster name的节点。
节点（node) ：集群中的一个Elasticearch实例
分片（shard）：索引可以被拆分为不同的部分进行存储，称为分片。在集群环境下，一个索引的不同分片可以拆分到不同的节点中

解决问题：数据量太大，单点存储量有限的问题。

在这里插入图片描述

此处，我们把数据分成3片：shard0、shard1、shard2

主分片（Primary shard）：相对于副本分片的定义。
副本分片（Replica shard）每个主分片可以有一个或者多个副本，数据和主分片一样。

数据备份可以保证高可用，但是每个分片备份一份，所需要的节点数量就会翻一倍，成本实在是太高了！

为了在高可用和成本间寻求平衡，我们可以这样做：

首先对数据分片，存储到不同节点
然后对每个分片进行备份，放到对方节点，完成互相备份

这样可以大大减少所需要的服务节点数量，如图，我们以3分片，每个分片备份一份为例：

在这里插入图片描述

现在，每个分片都有1个备份，存储在3个节点：

node0：保存了分片0和1
node1：保存了分片0和2
node2：保存了分片1和2

1.搭建ES集群

参考文章：ES（六）| ES集群搭建、使用cerebro来监控ES集群状态

2.集群脑裂问题

2.1.集群职责划分

elasticsearch中集群节点有不同的职责划分：

在这里插入图片描述

默认情况下，集群中的任何一个节点都同时具备上述四种角色。

但是真实的集群一定要将集群职责分离：

master节点：对CPU要求高，但是内存要求第
data节点：对CPU和内存要求都高
coordinating节点：对网络带宽、CPU要求高

职责分离可以让我们根据不同节点的需求分配不同的硬件去部署。而且避免业务之间的互相干扰。

一个典型的es集群职责划分如图：

在这里插入图片描述

2.2.脑裂问题

脑裂是因为集群中的节点失联导致的。

例如一个集群中，主节点与其它节点失联：

在这里插入图片描述

此时，node2和node3认为node1宕机，就会重新选主：

在这里插入图片描述

当node3当选后，集群继续对外提供服务，node2和node3自成集群，node1自成集群，两个集群数据不同步，出现数据差异。

当网络恢复后，因为集群中有两个master节点，集群状态的不一致，出现脑裂的情况：

在这里插入图片描述

解决脑裂的方案是，要求选票超过 ( eligible节点数量 + 1 ）/ 2 才能当选为主，因此eligible节点数量最好是奇数。对应配置项是discovery.zen.minimum_master_nodes，在es7.0以后，已经成为默认配置，因此一般不会发生脑裂问题

例如：3个节点形成的集群，选票必须超过 （3 + 1） / 2 ，也就是2票。node3得到node2和node3的选票，当选为主。node1只有自己1票，没有当选。集群中依然只有1个主节点，没有出现脑裂。

2.3.小结

master eligible节点的作用是什么？

参与集群选主
主节点可以管理集群状态、管理分片信息、处理创建和删除索引库的请求

data节点的作用是什么？

数据的CRUD

coordinator节点的作用是什么？

路由请求到其它节点
合并查询到的结果，返回给用户

3.集群分布式存储

当新增文档时，应该保存到不同分片，保证数据均衡，那么coordinating node如何确定数据该存储到哪个分片呢？

3.1.分片存储测试

插入三条数据：
在这里插入图片描述

测试可以看到，三条数据分别在不同分片：

在这里插入图片描述

结果：

{
    "took": 848,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 3,
            "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
            {
                "_shard": "[huangtu123][0]",
                "_node": "FTKQKOBwTVGOL5yzcB0MKw",
                "_index": "huangtu123",
                "_type": "_doc",
                "_id": "5",
                "_score": 1.0,
                "_source": {
                    "title": "测试插入一条数据，id=5"
                },
                "_explanation": {
                    "value": 1.0,
                    "description": "*:*",
                    "details": []
                }
            },
            {
                "_shard": "[huangtu123][1]",
                "_node": "xUEVsm22QOquZIupzAzqEw",
                "_index": "huangtu123",
                "_type": "_doc",
                "_id": "3",
                "_score": 1.0,
                "_source": {
                    "title": "测试插入一条数据，id=3"
                },
                "_explanation": {
                    "value": 1.0,
                    "description": "*:*",
                    "details": []
                }
            },
            {
                "_shard": "[huangtu123][2]",
                "_node": "xUEVsm22QOquZIupzAzqEw",
                "_index": "huangtu123",
                "_type": "_doc",
                "_id": "1",
                "_score": 1.0,
                "_source": {
                    "title": "测试插入一条数据，id=1"
                },
                "_explanation": {
                    "value": 1.0,
                    "description": "*:*",
                    "details": []
                }
            }
        ]
    }
}