ELK节点损坏后恢复整理
一、概述
因为机房断电重启,重启节点无资源分配,导致elk-data-2节点无资源调度,故而启动失败。加上之前ELK处理数据过高,Redis空间过载,服务集群崩溃。
二、解决思路
1:按数据传输流程,分析数据传输失败原因;
2:在配置文件里,除去坏死节点elk-data-2,将elk-data-master补上;
3:在RDM里清除之前索引并重启Redis清空缓存;
4:修改配置文件后,重启nginx-poxy、elk-data-1、elk-data-master上的Logstash服务;
5:检查监控是否正常。
三、解决步骤
1:分析错误日志整理