一、发现问题
今天的Elasticsearch突然之间出现问题,主服务启动后,从服务也启动了,但是backup上就是同步不了主master上面的数据。
然后开始做数据检查,我靠一看吓一跳:
elasticsearch/bin目录下产生类似如下文件:
当时压根没想到是这个原因导致的整个backup就是起不了。
解释一下【 .hprof 】文件
在elasticsearch/bin目录下产生类似如下文件的原因是:内存溢出的典型特征。
二、解决问题
有hs_err*.log或者hprof文件删除文件然后重启该节点,立马会重新从master节点同步数据,然后恢复服务。
删除节点下面的溢出错误文件
[zcsjw@iZ23evimvf8Z bin]$ rm -rf java_pid1*
停止当前有问题的backup节点
[zcsjw@iZ23evimvf8Z bin]$ ps aux |grep elastic
[zcsjw@iZ23evimvf8Z bin]$ kill -9 6059
重重启栋有问题的backup节点
[zcsjw@iZ23evimvf8Z bin]$ sh elasticsearch -d