一次VMware ESXi主机紫屏的故障处理

        上个月,有一台ESXi主机突然紫屏死机,重启后主机可以恢复正常,当时的紫屏信息如下:

        紫屏画面中直接报了Hardware Error - Please contact the hardware vendor。

硬件错误,建议联络硬件厂商。

        于是赶紧查看一下dump日志信息,在/var/core中找到了zdump文件。查看发现有如下信息:

Backtrace for current CPU #88

Machine Check Exception: Fatal MCE on PCPU88

System has encountered a Hardware Error - Please contact the hardware vendor

        查询VMware官方KB也说明了MCE的错误是硬件故障导致。KB中明确说明如果抛出 MCE 并显示紫色诊断屏幕,则说明是硬件问题引起的。没有其他方法可以生成 MCE。

        KB如下:

https://kb.vmware.com/s/article/1005184?lang=zh_CN

        由于CPU核心的编号是从0开始,所以CPU88就是第89个物理核心。

        使用esxcfg-info -a命令查看,得到如下信息:CPU88在node2上也就是第三个槽位的CPU。

\==+CpuImpl :
                     |----ID........................................88
                     |----Family....................................6
                     |----Model.....................................85
                     |----Type......................................0
                     |----Stepping..................................4
                     |----Name......................................GenuineIntel
                     |----CPU Speed.................................2095077810
                     |----Bus Speed.................................24941398
                     |----APIC ID...................................0x00000058
                     |----Node......................................2

        联络硬件厂商,更换CPU,更换后运行一周时间,目前没有紫屏现象发生,本次故障应该是得到解决了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

龙龙腾飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值