对于集群的扩容, 我们得心应手; 但遇到需要缩减集群时, 就有点难受
- 节点的数据如何迁移 (虽然有复本, 但不同索引的复本数不同, 且复本数限制了下线的节点数量)
- 下线节点, 业务程序相应的配置项也要考虑修改
- 下线节点可能还涉及到
discovery.zen.minimum_master_nodes
,discovery.zen.ping.unicast.hosts
等参数调整 - 如果保证正在使用es的业务程序不出错
1. exclude api
类似于HDFS的exclude操作, elasticsearch也有同样的机制
curl -H 'Content-Type: application/json' -XPUT localhost:9200/_cluster/settings -d '{
"transient" :{
"cluster.routing.allocation.exclude._ip" : "ip1,ip2"
}
}'
- ip1,ip2节点不再写入新数据; 且已有数据会逐步迁移及其他节点
2. 判断是否迁移完成
数据的迁移是个缓慢的过慢, 如何知晓整个过程已完成呢?
我们可以通过查询节点上的分片数, 如果为0, 则可以确认该节点数据已迁移完毕
curl -s localhost:9200/_cat/shards?v |egrep 'ip1|ip2' |wc -l
3. 后续操作
待数据迁移完成后
- 如果下线的节点只是data节点, 则不用修改配置项
discovery.zen.minimum_master_nodes
,discovery.zen.ping.unicast.hosts
- 如果下线的节点同时是master节点, 则必须调整
discovery.zen.minimum_master_nodes
,discovery.zen.ping.unicast.hosts
, 修改后重启, 可能出现单复本索引异常
4. 取消exclude
将exclude_ip置空即可
curl -H 'Content-Type: application/json' -XPUT localhost:9200/_cluster/settings -d '{
"transient" :{
"cluster.routing.allocation.exclude._ip" : null
}
}'