出现这种提示,说明你的集群状态是亚健康的,status是yellow,至少有一个副本分片没有成功创建,集群是能正常工作的,只是有丢失数据的风险。
一,问题定位
解决思路,首先查清楚问题所在,es提供一个api查看分片的信息。
http://localhost:9200/_cat/shards?h=index,shard,prirep,state,unassigned.reason
结果如下图,最后一行是分片创建失败的原因,图中的INDEX_CREATED标识在创建索引时副本就未创建成功。
根据es官网,各种副本分片创建失败原因如下:
1)INDEX_CREATED:由于创建索引的API导致未分配。
2)CLUSTER_RECOVERED :由于完全集群恢复导致未分配。
3)INDEX_REOPENED :由于打开open或关闭close一个索引导致未分配。
4)DANGLING_INDEX_IMPORTED :由于导入dangling索引的结果导致未分配。
5)NEW_INDEX_RESTORED :由于恢复到新索引导致未分配。
6)EXISTING_INDEX_RESTORED :由于恢复到已关闭的索引导致未分配。
7)REPLICA_ADDED:由于显式添加副本分片导致未分配。
8)ALLOCATION_FAILED :由于分片分配失败导致未分配。
9)NODE_LEFT :由于承载该分片的节点离开集群导致未分配。
10)REINITIALIZED :由于当分片从开始移动到初始化时导致未分配(例如,使用影子shadow副本分片)。
11)REROUTE_CANCELLED :作为显式取消重新路由命令的结果取消分配。
12)REALLOCATED_REPLICA :确定更好的副本位置被标定使用,导致现有的副本分配被取消,出现未分配。
下面针对每一种原因提出不同的解决方案。
二,INDEX_CREATED
1,根本原因
出现这个说明在创建索引时分片就无法正常创建,大概率原因是你的副本分片数设置有问题。
es规定副本分片和主分片不能在同一个节点,同一个节点不能存在两个相同的副本分片,所以副本分片书不能比节点数多。
举个例子,如果集群有3个节点,副本分片不能大于2。如果大于2,必然出现主分片和副本分片在同一个节点的情况出现。
2,解决之道
修改副本分片数小于结点数。