客户反馈有一台VNX5200 存储系统,故障灯点亮,有DPE故障的event提示,但找不到任何的故障部件。系统显示如下图所示:
对于这种问题,只有一个办法,收spcollect日志,只看图形界面的提示是无法判断故障原因的。
下面是对收集到的spcollect日志的解读:
系统提示故障来自bus 1 enclosure 1,如下所示:
我们可以缩小范围到这个扩展柜来看问题在哪里?
从SPA的KTCONS日志,可以看到明确显示是drive fault
但是从SPB的KTCONS日志看不到任何的drive fault报错。
这就是问题的根源,说明一个控制器认为有磁盘已经坏了,而另外一个控制器认为磁盘都是正常的,所以系统有告警而又查不到任何具体某个部件是否错误的提示。
继续检查splogs日志,发现1-1-6磁盘大量的scsi 报错。
将这个盘更换以后,故障灯消失,问题解决。