背景:

某客户一套SVC集群共6个node,其中一个node脱离集群,业务发生短暂切换后恢复正常。

(服务助手显示node1丢失)


处理步骤:

1、登陆SVC查看事件有1195代码的事件,即节点脱机超过30分钟。

查看SVC液晶面板,其余5个显示1195, 脱机节点显示 1203

(查看1203错误信息为 检查到FC通道有异常)


2、分别登陆SAN交换机查看4个端口的状态都不正常(MDS交换机,init状态),拨线发现都有光。

交换机端几乎不可能同时出两台交换机4个端口故障,光纤线同理,怀疑NODE的硬件有问题,接显示器查看  有 kernel panic࿰