一、问题描述
某次巡检发下,VSAN集群中,某主机报:主机错误;结果在将其至于维护模式过程中,vm迁移错误;查看集群VSAN磁盘状态,发现部分主机报错:未知对象类型 不可访问,,集群中显示有:不可访问的vsan对象(inaccessible vSAN objects) ;如下:
而且,故障主机上跑着有vm,迁移vm时报错:
相关资源:vsan文档
二、问题分析
1)检查不可访问的虚拟对象,发现这些对象并非在14主机的单一磁盘组里:
2)官方解释:这是因为在解析VMDK路径时,ESXi无法很好地处理某些特殊情况,提取了错误的vSAN UUID,导致重复的VM主文件夹触发了不可访问对象的失败警报。对生产没有影响;
3)解决:升级VSAN到6.7P02或更高版本,实际就是将Sphere 6.7.0U3b 升级到跟高版本;当前版本为:6.7.0 P1版本
可在esxi主机上执行:esxcli software vib get -n vsanhealth