一、故障定位
1.1.故障信息
Log摘要 Storage Subsystem: SHSJZ-VOICE |
1.2.故障定位
使用IBM管理软件,获取Log ,在Log中报出控制器A电池失效。
经过确认控制器A电池因没电引起告警。
需要更换控制器A电池。
二、故障处理
2.1.先决条件
注意 |
操作时,使用防静电护腕 添加或更换硬件组件之前请作好数据备份。如果部件未正确安装,则可能会导致数据丢失。 |
2.2.准备项
准备确认项 | ||
类型 | 准备项 | 状态 |
硬件 | 笔记本一台 | 已准备就绪 |
网线三根 | 已准备就绪 | |
交换机一台 | 已准备就绪 | |
十字螺丝刀一把 | 已准备就绪 | |
防静电护腕一个 | 已准备就绪 | |
标签纸若干 | 已准备就绪 | |
新控制器电池 | 已准备就绪 | |
软件 | 最新版IBM Storage Manager | 已准备就绪 |
其它 | ||
2.3.操作项
操作项列表 | |||
序号 | 操作项 | 操作内容 | 时间(共计2h) |
1 | 业务数据备份 | 建议客户应用及业务数据备份 | |
2 | 业务暂停操作 | 确认暂停业务运行 | |
3 | 连接控制器 | 笔记本通过网线连接交换机 | 15m |
两个控制器通过网线分别连接交换机 | |||
配置好笔记本IP地址 | |||
打开SM客户端 | |||
确认连接两个控制器 | |||
4 | ASD收集保存 | 通过SM客户端进行ASD(All Support Data)收集和保存 | 30m |
确认ASD(All Support Data)收集保存的数据已经存在 | |||
6 | 物理通路风险 | 登陆主机确认主机的两条物理通路(主机光纤卡至Logical Drive的通道)都是正常的 | |
7 | 标签纸标识 | 用标签纸对光纤收发两路做唯一标识 | 30m |
确认对光纤标识正确 | |||
8 | LUN切出操作 | 记录所有LUN对应的控制器 | |
通过SM客户端软件确认切出LUN的read caching、write caching、Enable write caching without batteries都已经Disable | |||
通过SM客户端软件把需更换电池控制器上的LUN切换到另外一个控制器上 | |||
确认LUN切换操作有效 | |||
9 | Offline操作 | 通过SM客户端软件对需更换电池控制器进行Offline操作 | |
确认Offline操作有效 | |||
10 | 更换电池 | 硬件更换操作员佩戴好防静电护腕 | 30m |
拔掉用标签纸做过唯一标识的光纤 | |||
拔出包含故障电池的控制器 | |||
电池物理更换 | |||
确认电池已经正确安装 | |||
插回更换过新电池的控制器 | |||
确认控制器已经有效插回 | |||
插回用标签纸做过唯一标识的光纤 | |||
确认光纤已经正确插回 | |||
11 | Online操作 | 等待5分钟左右 | |
通过SM客户端软件Online该控制器 | |||
确认Online操作有效 | |||
12 | Reset电池 | 等待15分钟左右(15分钟至72小时内) | |
确认新电池完全充满电; (控制器后部会有绿色灯闪烁,表明在充电,大约15分钟后充满,一般是在15分钟至72小时之内充满) | |||
通过SM客户端软件Reset新电池寿命 | |||
确认新电池已经Resrt | |||
13 | 物理通路风险 | 确认主机的两条物理通路(主机光纤卡至Logical Drive的通道)都是正常的 | |
14 | LUN切回操作 | 对照LUN对应的控制器记录,把LUN切换回控制器 | |
确认LUN切回操作有效 | |||
通过SM客户端软件确认切出LUN的read caching、write caching、Enable write caching without batteries都已经Enable | |||
15 | 确认正常 | 通过SM客户端软件确认无相关告警 | 15m |
16 | 确认业务恢复 | 确认客户业务已经恢复正常 | |
17 | 清理现场 | 更换电池操作完毕,清理现场,整理准备项所列硬件 |
三、参考信息
转载于:https://blog.51cto.com/xiaozhuang/1354819