问题描述
某主机内存故障,主机运维人员更换完成后,对主机重启进行验证,BMC界面显示相关硬件状态已经恢复,但当讲该主机退出维护模式时,重启集群HA,报如下错误:
分析处理
2.1、几种HA代理状态说明
1)vSphere HA 代理处于代理----无法访问状况
状态说明:主机上的 vSphere HA 代理已处于代理无法访问状况一分钟或更长时间。可能需要用户干预来解决这种情况。
问题描述:当首选主机或 vCenter Server 无法访问主机的代理时,vSphere HA 会报告代理处于代理无法访问状况。因此,vSphere HA 无法监控该主机上的虚拟机,并且在出现故障后可能不会重新启动这些虚拟机。
可能原因:vSphere HA 代理可能因多个原因而处于代理无法访问状况。这种情况通常表示网络连接问题正在阻止 vCenter Server 访问首选主机和主机上的代理,或表示群集中的所有主机都失败。这种情况还可能表示一种不太可能的情况:vSphere HA 已被禁用并已在群集中重新启用但 vCenter Server 无法与主机上的 vSphere HA 代理通信,或主机上的代理已失败且监视程序进程无法将其重新启动。
解决方案:确定 vCenter Server 是否报告主机无响应。如果是,则说明存在网络问题或整体性群集故障。解决上述任一种情况后,vSphere HA 应可正常工作。如果未正常工作,请重新配置主机上的 vSphere HA。同样,如果 vCenter Server 报告主机有响应但主机状态为“代理无法访问”,请重新配置该主机上的 vSphere HA。
2)HA 代理处于----未初始化状况
状态说明:主机上的 vSphere HA 代理已处于未初始化状况一分钟或更长时间。可能需要用户干预来解决这种情况。
问题描述:当主机的代理无法进入运行状况并成为首选主机时,或无法连接到首选主机时,vSphere HA 会报告代理处于未初始化状况。因此,vSphere HA 无法监控该主机上的虚拟机,并且在出现故障后可能不会重新启动这些虚拟机。
可能原因