Elasticsearch分布式架构笔记

最新推荐文章于 2024-07-30 01:17:14 发布

凝望深蓝

最新推荐文章于 2024-07-30 01:17:14 发布

阅读量190

点赞数

分类专栏： Elasticsearch 文章标签： elasticsearch 分布式架构

本文链接：https://blog.csdn.net/u013408188/article/details/123106737

版权

Elasticsearch 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文详细探讨了Elasticsearch的分布式架构，包括shard和replica机制、单node环境下的index创建、集群扩容过程以及容错机制。重点阐述了分片负载均衡、副本的角色、节点对等特性和主副本在容错中的作用。通过举例说明了如何在不同场景下进行水平扩容，提升系统性能和容错性。

摘要由CSDN通过智能技术生成

Elasticsearch分布式架构

Elasticsearch对复杂分布式机制的透明隐藏特性
Elasticsearch是一套分布式的系统，分布式是为了应对大数据量，隐藏了复杂的分布式机制。
（1）分片机制
（2）cluster discovery（集群发现机制）
（3）shard负载均衡（es会自动对shard进行均匀分配，以保持每个节点的均衡的读写负载请求）
（4）shard副本，请求路由，集群扩容，shard重分配
Elasticsearch的垂直扩容与水平扩容
（1）垂直扩容：采购更强大的服务器，成本非常高昂，而且会有瓶颈
（2）水平扩容：业界经常采用的方案，采购越来越多的普通服务器，性能比较一般，但是很多普通服务器组织在一起，就能构成强大的计算和存储能力
（3）扩容对应用程序的透明性
增减或减少节点时的数据rebalance
保持负载均衡
master节点
（1）创建或删除索引
（2）增加或删除节点
节点对等的分布式架构
（1）节点对等，每个节点都能接收所有的请求
（2）自动请求路由
（3）响应收集

shard&replica机制

1）index包含多个shard
（2）每个shard都是一个最小工作单元，承载部分数据，lucene实例，完整的建立索引和处理请求的能力。
（3）增减节点时，shard会自动在nodes中负载均衡。
（4）primary shard和replica shard，每个document肯定只存在于某一个primary shard以及其对应的replica shard中，不可能存在于多个primary shard。
（5）replica shard是primary shard的副本，负责容错，以及承担读请求负载。
（6）primary shard的数量在创建索引的时候就固定了，replica shard的数量可以随时修改。
（7）primary shard的默认数量是5，replica默认是1，默认有10个shard，5个primary shard，5个replica shard。
（8）primary shard不能和自己的replica shard放在同一个节点上（否则节点宕机，primary shard和副本都丢失，起不到容错的作用），但是可以和其他primary shard的replica shard放在同一个节点上。

单node环境下创建index

PUT /test_index
{
   "settings" : {
      "number_of_shards" : 3,
      "number_of_replicas" : 1
   }
}

（1）单node环境下，创建一个index，有3个primary shard，3个replica shard
（2）集群status是yellow
（3）这个时候，只会将3个primary shard分配到仅有的一个node上去，另外3个replica shard是无法分配的
（4）集群可以正常工作，但是一旦出现节点宕机，数据全部丢失，而且集群不可用，无法承接任何请求

Elasticsearch横向扩容过程

如何超出扩容极限，以及如何提升容错性
1）primary&replica自动负载均衡，6个shard，3 primary，3 replica
（2）每个node有更少的shard，IO/CPU/Memory资源给每个shard分配更多，每个shard性能更好
（3）扩容的极限，6个shard（3 primary，3 replica），最多扩容到6台机器，每个shard可以占用单台服务器的所有资源，性能最好
（4）超出扩容极限，动态修改replica数量，9个shard（3primary，6 replica），扩容到9台机器，比3台机器时，拥有3倍的读吞吐量
（5）3台机器下，9个shard（3 primary，6 replica），资源更少，但是容错性更好，最多容纳2台机器宕机，6个shard只能容纳0台机器宕机
（6）这里的这些知识点，你综合起来看，就是说，一方面告诉你扩容的原理，怎么扩容，怎么提升系统整体吞吐量；另一方面要考虑到系统的容错性，怎么保证提高容错性，让尽可能多的服务器宕机，保证数据不丢失

Elasticsearch容错机制

master选举，replica容错，数据恢复
（1）9 shard，3 node
（2）master node宕机，自动master选举，red
（3）replica容错：新master将replica提升为primary shard，yellow
（4）重启宕机node，master copy replica到该node，使用原有的shard并同步宕机后的修改，green