问题描述:原本是运行ESXI无任何问题,需要重新安装Ubuntu系统以及安装后会产生下列问题,重启后通过idrac查看内存又是正常的;
出现错误问题的两种情况,会导致服务器异常卡死导致iDRAC控制台无信号必须重启机器后才行,然后不定时又存在上述问题:
- 1.服务器安装系统时候会出
- 2.服务器远程登录执行任务时
已操作的方法但没有什么效果:
- 1.断电60S,释放静电后重启;
- 2.更换内存卡槽(离CPU最远A1/B1未查)A1 /B1-> A2/B2,A2/B2->A3/B3
服务器相关信息:
系统型号 PowerEdge R730
服务标签
快速服务代码
BIOS 版本 2.4.3
固件版本 2.63.60.61
Lifecycle Controller 固件2.63.60.61
IDSDM 固件版本 N/A
系统主机名 centos
操作系统 CentOS Linux 7 (Core)
操作系统版本 7 (Core) Kernel 3.10.0-1127.el7.x86_64 (x86_64)
# 处理器信息
CPU 1 Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz Model 79 Stepping 1 2200 MHz 检测到存在 10
CPU 2 Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz Model 79 Stepping 1 2200 MHz 检测到存在 10
# 内存信息
内存属性
已安装容量 64.00 GB
最大容量 3072.00 GB
可用插槽数 24
已用插槽数 4
错误纠正 Multi-bit ECC
DIMM A2 DDR-4 16.00 GB 检测到存在 双列 2133 MHz
DIMM A3 DDR-4 16.00 GB 检测到存在 双列 2133 MHz
DIMM B2 DDR-4 16.00 GB 检测到存在 双列 2133 MHz
DIMM B3 DDR-4 16.00 GB 检测到存在 双列 2133 MHz
# idrac 报错日志:
Sun Sep 27 2020 02:46:34 The watchdog timer power cycled the system.
Sun Sep 27 2020 02:38:57 The watchdog timer expired.
Mon Sep 21 2020 14:39:30 CPU 1 machine check error detected.
Mon Sep 21 2020 14:39:30 Multi-bit memory errors detected on a memory device at location(s) DIMM_A2.
Mon Sep 21 2020 14:39:30 Multi-bit memory errors detected on a memory device at location(s) DIMM_B2.
Mon Sep 21 2020 14:39:30 A problem was detected related to the previous server boot.
idrac显示的错误日志信息
内存开机已通过自检
异常重启后显示错误的信息
已将 SupportAssist 允许用户下载和查看系统运行状况收集导出:
希望寻求DELL社区以及各位大佬的帮助,谢谢~