Elasticsearch 顶尖高手(8)—_shard&replica机制再次梳理以及单node环境中创建index图解...

最新推荐文章于 2022-12-24 09:57:34 发布

转载最新推荐文章于 2022-12-24 09:57:34 发布 · 240 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/Mr-WangYue/p/11519251.html

文章标签：

#大数据

本文深入解析了Elasticsearch中的shard和replica机制，阐述了它们如何作为最小工作单元承载数据，实现索引建立和请求处理，以及在节点增减时的自动负载均衡。同时，详细说明了primary shard和replica shard的区别与作用，包括数据分布原则、容错机制和读请求负载平衡。

1.shard&replica机制再次梳理

index包含多个shard
每个shard都是一个最小工作单元，承载部分数据，lucene实例，完整的建立索引和处理请求的能力
增减节点时，shard会自动在node中负载均衡
primary shard 和 replica shard ，每个document肯定只存在于某一个primary shard 以及其对应的replica shard中，不可能存在于多个Primary shard
replica shard是primary shard的副本，负责容错，以及承担读请求负载
primary shard的数量在创建索引的时候就固定了，replica shard的数量可以随时修改
primary shard的默认数量是5，replica默认是1，默认有10个shard，5个primary shard，5个replica shard。
primary shard 不能和自己的replica shard放在同一个节点上(否则节点宕机，primary shard和副本都丢失，起不到容错作用)，但是可以和其他primary shard的replica shard放在同一节点上

2.图解单node环境下创建index是什么样子的

单node环境下，创建一个index，有3个primary shard，3个replica shard
集群status是yellow
这个时候，只会将3个primary shard分配到仅有的一个node上去，另外3个replica shard是无法分配的
集群可以正常工作，但是一旦出现节点宕机，数据全部丢失，而且集群不可用，无法承接任何请求

PUT /test_index

{

“settings”:{

“number_of_shards”:3,

“number_of_replicas”:1

}

转载于:https://www.cnblogs.com/Mr-WangYue/p/11519251.html