启动初始化时间长
修改es配置,重启集群成本巨大。ES集群已有25T数据,27个节点,24个数据节点(热盘12和hot节点,慢盘12个stale节点,3个mater节点),数据节点的启动,加入集群后需要初始化全部索引,这个过程过程很慢。全部重启一次可能要一天,非常耗时。重启后经常遇到少量索引一直处于unassigned状态,导致集群一直是red状态。
目标
有时调整配置,希望能快速重启生效(能用api改的优先不停服务修改),减少es服务停顿时间。
master节点和stale节点修改配置可以随时重启。
hot数据节点最好在晚上或者周末重启,重启前最好先停止数据写入。
发现启动前如果事先关闭shard自动均衡,初始化索引速度会快得多。因此我们完善了下操作流程