简介
问题发生了死机,但是从系统日志(messages)上查看死机时间居然发生了断层,那该怎么排查呐?
初步分析
1、简单了解情况,问题是不是必现问题,是不是多次发生;
2、如果是必现以及多次发生那么断层就好处理。
部署kdump
部署kdump能更好的获取中间消息的日志信息:
1、查看crashkernel大小
#demsg |grep crashkernel(显示=auto需要进行修改)
#vim /etc/default/grub(crashkernel=auto,修改为512M,没有
该参数在GRUB_CMDLINE_LINUX=中添加crashkernel=512M)
2、更新grub
#grub2-mkconfig -o /boot/efi/EFI/uos/grub.cfg
3、重启系统
#reboot
4、查看更改状态
#demsg |grep crashkernel(显示512M)
#systemctl status kdump
(显示active)
5、模拟测试
#echo 1 > /proc/sys/kernel/sysrq
#echo c > /proc/sysrq-trigger
6、查看文件
#cd /var/crash/
(日期目录中存在vmcore为正常生效)
无复现情况
这种情况比较难办可以使用journalctl -k查看更为详细的日志看看能不能找到一些重要信息。
例子:

小编在journalctl -k总发现了一段来自硬件的错误日志;
看日志情况错误事件不是致命,而类型是致命的,应该出现了严重的硬件错误才会打印出这些,可能是处理器存在问题,需要更为详细的分析。
7587

被折叠的 条评论
为什么被折叠?



