今天早上发现一台centos异常关机,导致了服务异常,那么如何排查是什么原因导致的关机,避免下次再出现这样的问题?
导致关机的原因有很多,如内存溢出,流量过大,io操作频繁等都有可能造成机器关机。
可以先确定关机的时间点,在日志中去查看该时间段的日志,看是否有错误日志。常用的日志有message,dmesg等
常用的查询语句
查看报错
tail -200 /var/log/messages |grep "Error"
cat /var/log/dmesg |grep "Error"
查看内核崩溃日志
tail -200 /var/log/messages |grep "crash"
查看是否出现OOM,一般会出现kill杀死进程的情况
cat /var/log/messages |grep -i "kill"
还可以查看宕机时间段的日志,查看12月11日15点的日志
cat /vat/log/messages |grep "Feb 11 15*"
确定关机或者重启的时间
last reboot 重启时间
last -F |grep crash
last
参考链接