周一到公司,首先是看邮件,打开Veeam BR的备份邮件发现有error,检查veeam BR的详细备份日志,发现是“虚拟机 is disconnected”的报错
 
于是登入vCenter检查esxi主机,发现其中一台esxi主机是失去连接的,如下图:
 
并且该esxi上的虚拟机也是处于“断开,无响应”的状态,不过该ESXi上的虚拟机都是处于正常工作的状态,可以ping通该主机,于是尝试着连接该esxi主机,报“Datacenter.QueryConnectionInfo” 失败错误。查看ESXi和vpxd.log都无明显的报错信息。

  
搜索了一下,这个报错一般都是由于网络,DNS解析的问题导致的,但是我是用IP地址直接连接的,也是报这个错误,Ping IP地址是通的。然后就是检查esxi的管理服务了。
 
打开esxi主机的远程SSH,登陆到esxi主机,用vm-support命令查看目前是否有虚拟机在该esxi主机上运行。
  
如图所示,那些断开的虚拟机并没有自动迁移到HA集群中的其他主机上,依然在该ESXi主机上运行,那么这台ESXi主机就不能随便重启了。
 
于是尝试着重启一下esxi的管理服务,用services.sh restart命令,重启后esxi恢复