今天给大家分享一个维修案例:

机器型号:SA5212M4  , 阵列是LSI卡,最初级的阵列卡,硬盘有小问题时不会告警。此机有后置硬盘,属于定制机器。

今天运维发邮件告知有台浪潮服务器硬盘有故障。但我们现场巡检没发现有问题,没有任何报错,状态灯正常。

当时我想到的是可以硬盘有坏道,读写有延迟大,系统判断硬盘故障。根据邮件发来内容:

某机房主机172.27.12.58磁盘/dev/sdl故障。现在有个疑惑,现场没有报警提示,不知道哪块硬盘坏,这下急啦。后来想到可以通过硬盘序列号来查出坏硬盘是哪块。通过命令可以smartctl -a /dev/sdl/,找出硬盘序列号,再根据硬盘的位置,sda对应是第一个硬盘,如此类推,定位硬盘,运维提供的硬盘序列号,核对是否一致。


以下是我总结的操作步骤:

厂家人员到场----》邮件通知运维关机(紧急时可电话)----》到场机器开机,并接显示器查看状态,自检中错误的硬盘没显示请与运维联系查看硬盘序列号(需要运维开机再关机,并邮件告知我们序列号)-----》硬盘序列号核对后进行更换。


以上是个人的经验,纯粹个人笔记,不好勿喷!