本技术文档旨在为刚接触存储设备的工程师提供一个详实的指南,介绍在遇到磁盘故障时如何稳妥处理和更换磁盘的全过程。磁盘故障是存储系统维护中常见的挑战之一,正确且迅速地应对这些问题对于确保数据的安全性和系统的稳定性至关重要。本文将通过简明扼要的操作步骤,指导读者识别磁盘故障、准备更换工作以及完成磁盘更换后的验证过程。无论是为了减少系统停机时间还是保障数据完整性,遵循本文档提供的方法都将帮助新手工程师们更加自信地面对存储设备的磁盘异常问题。
1、故障现象
1.1、华为存储阵列磁盘位8,故障灯红色闪烁告警。物理排查判断磁盘已损坏。
1.2、登陆web管理界面 https://存储IP:8088
硬盘(控制框 CTE0,槽位号 8,序列号 -------,BOM编码 --)故障已离线。确认磁盘已损坏。
1.3、与华为技术支持热线联系后,技术支持工程师反馈可用专用管理工具直接更换磁盘。单个磁盘故障后数据直接同步至其他盘,对数据无影响。
2.1.1、首先采购与故障盘相同型号与bbom编码一致的磁盘,标红为必须一致否则无法使用。详细磁盘信息如下:
2.1.2、下载存储设备管理软件:
下载管理工具需要华为账号,注册完成后,在个人中心内绑定存储设备,设备序列号在web管理界面中可查询到。
a)进入smartkit工具下载页面
b)确认版本中有xxxx_zh.zip软件包(主程序),否则返回选择次新版本,依次类推
选择xxxx_zh.zip软件主程序后,同时需要下载描述带有CRU更换部件的补丁包。否则工具界面无CRU更换工具。
c)下载完成后首先安装XXXX_zh_zip主程序,安装完成后,选择CUR插件补丁包导入,即可完成管理工具安装的全部操作。
2.2更换前管理工具所需配置项
b)设备列表中点击 添加 按钮
c) 弹出对话框中选择添加方式, 填写设备IP地址:后下一步
d)填写设备用户名密码(web管理界面密码) 端口号默认22,点击完成。
e)至此设备添加完成。结果如下所示
2.3、故障磁盘更换
b)弹出对话框中点击备件更换(CRU)
c)点击备件更换(CRU)
d)弹出对话框中选择存储设备5300V3 点击确定
e)CRU更换界面 选择 硬盘选项,更换步骤分为5步,工具会引导每步的操作方式。
f)弹出对话框中勾选“只显示故障磁盘”选中磁盘8,勾选相关声明后点击确定。
g)更换前准备会检测故障磁盘的状态,全部通过后点击下一步。
h) 步骤5-3中提示需要更换磁盘的方式,点击下一步即可,注意:此步骤不要拔磁盘
i)进入到步骤5-4后,拔出带有故障灯红色告警的磁盘,等待30秒左右,将备件接入相同槽位中。
点击确认已更换按钮,等待系统检测。
g)待更换的磁盘完成检测后,点击下一步。 过程3分钟左右。
k)检测全部完成后,提示已更换完成。更换完成后磁盘开始同步信息阵列绿色指示灯闪烁频率增高。
至此磁盘更换完毕。
l)登陆web管理平台查看系统状态,此时告警已消除,查看阵列状态磁盘8正常。
至此磁盘更换全部完成,状态正常。
3、总结
此次磁盘故障时间较长,未及时更换。
磁盘采购过程中出现采购设备不匹配问题,原因为bbom码不对应,需加强相关产品的熟知。