如果vSphere环境没有遵循最佳实践,那么通常意味着需要花费更多的时间和精力来解决vCenter服务器出现的问题。
也许你也拥有类似的体会,有时我会在数据中心的排错过程当中获得一些平时难以学习到的经验教训。而这篇文章讲述的是在安装系统补丁导致vSphere vCenter出现问题之后,将会面临哪些问题以及恢复过程。
问题起初并没有什么特别现象,只是vSphere vCenter不能正常工作。由于上次没有正常关闭或者启动,所以为了解决这个问题,我尝试将其重启。然而重启之后真正的问题来了,vCenter再也无法启动。
寻找问题
首先,我必须寻找vCenter位于哪台宿主服务器上,使用ILO(Integrated Lights-Out)手动登陆到每台服务器上,禁用锁定模式,之后使用vSphere client登陆。这是一项非常耗费时间的工作。但是,如果你只有几台宿主服务器,任务将会轻松很多。当你拥有超过20台宿主服务器时,这样做将会花费很长时间,并且在找到该宿主服务器之前,都会不断地质疑自己的基础架构管理方式。
限制vCenter所在宿主服务器范围
为了避免延长故障时间,让你的工作更加轻松,可以通过创建DFS规则来限制vCenter可以位于哪些宿主服务器,或者使用机器迁移选择来阻止vCenter在不同宿主之间移动,除非宿主服务器出现问题。我个人推荐使用DRS规则的方式来限制vCenter只能在几台特定的宿主之间移动。
在我发现并打开虚拟机控制台之后,发现故障可能是因为更新没有正常安装所导致的。其他人为这台服务器安装了补丁,但是却导致了现在的问题。在尝试多次重启之后,服务器依然不能正常启动。在系统启动时,我选择了 “上一次已知的正确配置,