ELK 系统崩溃,无法使用 解决方案
之前使用还好好的没有问题,突然崩溃,弄了两天解决方案
遇到的问题
我的elk是部署在docker 上,一般来说 也许时间跨度较大搜索会导致系统崩溃,这也是elk系统不好的地方。但是这种几率小,并且这种情况一般来说 restart docker 就能够解决的,其次我如下图是Elasticsearch 服务每次开启后用kibana访问又会挂掉,如果不见效请看下面解决!
elk的保护机制
elk有个保护机制是 磁盘空间剩余量的问题,磁盘空间最好是处于保护状态下的 85%以下,不然 Elasticsearch 进入保护状态会导致索引只读状态或放弃索引,无法新建索引,导致kibana读取不到数据,最后崩溃。
解决方案
保留近三个月的日志索引,删除其他的,然后可以加入一个定时任务,定期清理索引,把空间腾出来重启即可
提醒事项
最好使用API去删除索引,如果手动删除请注意,不要瞎删,否则只能重装elk