故障现象:
1. 数据库SDS集群两个节点全部宕机
2. 数据库服务器上无法执行parted -l ;multipath -ll等操作,扫不到磁盘
3.数据库侧判定为存储故障或主机故障,反正是操作系统认不到磁盘
存储工程师排查:
1. 发现该存储映射给其他主机的磁盘正常使用
2. 存储新划分一个磁盘,映射给故障的主机,可以正常识别
3. 数据库工程师在parted划分磁盘之后,又无法识别了partprobe无法执行
集成商:
1.重启故障的主机,无效果
在最后绝望的时刻,存储工程师重启了整个磁盘阵列,所有问题迎刃而解。
这是什么鬼?
这是什么套路?
问题在哪里?
难道下次还重启磁盘阵列?