dell R系列服务器 开机出现各种报错,终极解决系列方法

现状:

公司有几十台dell R系列服务器已使用4年之久,由于上半年业务类型发生变动。决定对IT相关进行整改,在硬件方面,提出服务器硬件资源整合的想法。遂和同事一起将几台服务器整合成了2台高配。

问题

整合成功后,在其中一台DELL R720服务器整合前(CPU8核、内存32G、硬盘3块怀的。整合后(CPU16核,内存64G、硬盘9TB)上开机进入vmware ESXI 6.7.0 之后,会在服务器面板上提示 error 1|2|3的问题
问题1 .CPU0704 CPU1 machine check error detected. Power cycle system.
问题2 E1245 CPU 2 错误啥的
问题3 cpu0000 cpu1 internal error (IERR) contact support -poweredge R720 server

解决

艰难的解决问题之路开始了

初期解决

一、将BIOS电池拔掉,主板放电。开机测试....无效。
二、将BIOS恢复出厂化设置。开机测试.....无效。
三、记录服务器LED面板滚动的错误信息,到DELL官网查询,按上面解决办法来搞。开机测试.....无效。
这个过程经历了一个月之久(也因为其他运维事情在拖....

中期解决

四、得知DELL服务器有一个远程管理接口 iDRAC ,遂趁着服务器开机之时赶紧远程浏览器进去查看,结果没有密码,使用官网默认的密码也无法登陆进去,遂将此方法作罢。
经过这四大次的尝试排错,无法解决,部门一致决定弃用此台服务器....本人也好心痛,公司好的服务器也就这些,扔一台高配,真是跟三天不吃饭加上丢一万块钱的心情

后期解决

在经过了各种摸索不可以之后,突然有一种想法,日志!!!
服务器都有日志存储的功能,是不是因为服务器存储了硬件的信息,让服务器按照原来的日志来读取硬件,导致新增加的硬件无法被识别,导致错误呢?
遂钻机房,开机。经过5小时漫长摸索,将DELL服务器BIOS环节每个功能都进去翻看了一遍。原来各种问题的造成,是由于DELL 服务器在iDRAC环境中保存的有一份硬件资源图。这张图会记录硬件资源的详细信息。
如果硬件更新后,但是iDRAC没有更新,那么BIOS默认会读取旧的硬件资源图。鉴于此,思考若清除之后,会不会自动重新生成硬件资源图呢(新增后的硬件信息)
思考良久,决定一试。
1.按 F10 进去DELL lifcycle conronller (生命周期管理控制器)
开机有显示lifcycle conronller   只是没有 F10 .
 1.2 按F2-->iDRAC Settings -->Lifecycle Controller -->Enabled -->Back -->Finish  -->Yes to save the settings and exit the utility,然后就正常了。
 2.重启,按 F10 进入 lifcycle conronller
 选择固件更新>启动硬件回滚,提示会回到出厂化配置的。
 这种出厂化配置是直接将iDRAC恢复到出厂化的哦....
 初始化过程:配置语言>ip地址,就可以了。此时在 硬件配置里是可以看到当前服务器所有的硬件信息了。保存不保存都不所谓,万一以后随时增删硬件呢?
 直接敲回车!
 3.重置完成。保存退出

至此,提示的CPU 、电源等问题都解决了 。

后续动作

1.新建RAID5+全局热备操作,清除磁盘。
这步可以做可以不做的。

整体思路就是
重置BIOS>出厂化iDRAC>硬件回滚。

解决问题了,挺开心的。就是这是基础设备类的,感觉有点不值得,因为好耗费时间啊。

  • 6
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值