问题现象
昨天给es集群新增了warm
节点,在elasticsearch.yml
中配置如下node.roles: [data, data_warm]
但是今天发现集群yellow,有个分片无法分配,通过GET /_cluster/allocation/explain
可以看到报错如下:
问题分析
ps,实际上每个节点都有这个报错,我截取的是warm节点的内容。折腾半天,才发现具体原因。
首先是因为我之前测试冷热分层的时候,使用的是腾讯云的文档腾讯云的文档,文档里的做法是:
- 给节点增加一个属性,比如
node.attr.temperature: warm
- 再给索引增加一个参数,比如
PUT hot_data_index/_settings
{
"index.routing.allocation.require.temperature": "warm"
}
也就是说,这个索引会分配到tempertaure
为warm
的节点上。
而我在设置冷热节点的时候,参考的别人的文章,节点的属性是node.attr.key: warm
,也就是key
这个值是warm
。
看出问题来了没?我设置的是key
,而腾讯云文档设置的是tempertaure
。索引要去找的是tempertaure
,显然就找不到了。
解决办法
解决办法很简单,将这个节点的key值给清理掉
PUT /index-name/_settings
{
"settings": {
"index.routing.allocation.require.temperature": null
}
}
然后回到es,立刻就会看到提示1 initializing shards
。过会就变成绿色了。
另外,需要注意的是,在es7.16文档里,冷热节点的标准设置方法并不是腾讯文档里的那种做法,而是直接在elasticsearch.yml
里设置node.roles: [data, data_warm ]
即可。
不规范文档害死人啊。。。