192.168.219.90 使用 dmesg|grep -i error 查看时发现这台机器内存有问题,如下图所示:
[Hardware Error]: MC4 Error (node 1): L3 cache tag error.
[Hardware Error]: Error Status: Corrected error, no action required.
[Hardware Error]: MC4_ADDR: 0x00000018edfd9100
[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: SNP
[Hardware Error]: MC4 Error (node 2): DRAM ECC error detected on the NB.
EDAC amd64 MC2: CE ERROR_ADDRESS= 0x8cf6cb900
[Hardware Error]: Error Status: Corrected error, no action required.
[Hardware Error]: MC4_ADDR: 0x00000008cf6cb900
[Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: RES (no timeout)
[Hardware Error]: MC4 Error (node 2): DRAM ECC error detected on the NB.
EDAC amd64 MC2: CE ERROR_ADDRESS= 0x8cf6cb900
[Hardware Error]: Error Status: Corrected error, no action required.
[Hardware Error]: MC4_ADDR: 0x000

在192.168.219.90服务器上通过dmesg命令发现内存错误,主要涉及MC4节点的L3缓存和DRAM ECC。经过分析,确定第5条内存(DIMM_F1)存在问题。使用edac模块和dmidecode工具定位到具体内存条,并建议通过更换或重新插拔内存解决错误。
最低0.47元/天 解锁文章
379

被折叠的 条评论
为什么被折叠?



