摘要
VMware vSphere 6.7的老版本驱动(VMware Tools v12.1.0(含)以前版本)与2023年7月11日微软发布的Windows Server 2019更新包(KB5028168)不兼容,导致安装该更新后虚拟机无法正常启动。
问题描述
近日,单位的几台Windows Server 2019虚拟机突然故障,启动后停留在下面的“选择键盘布局”界面。
选择键盘布局后,进入下面的疑难解答界面。
选择“疑难解答”后,进入下面的“高级选项”界面。按照“启动修复”、“卸载更新”的提示操作均无法解决,虚拟机仍然无法正常启动。
排查过程
单位的虚拟化采用VMware vSphere 6.7环境,同版本操作系统的虚拟机有几十台,但出现故障的仅有2台。基于安全考虑,单位每天对虚拟机进行增量备份,可还原至前7天任意备份。通过恢复2台故障虚拟机前一天的备份,观察发现没多久系统会自动安装2023年7月的更新包(KB5028168),然后故障全部都重现。基本可以断定与该更新包有关。
但为什么绝大数虚拟机没有问题,仅这2台虚拟机出问题。通过逐台查看同类虚拟机的补丁更新记录,发现多数都已自动更新了KB5028168补丁且没有出现问题、部分机器已更新但未重启。因此,初步排除虚拟化平台和操作系统版本因素。
根据以前的经验,windows自动进入修改状态通常与驱动的兼容性有关。而VMware vSphere中Windows虚拟机的驱动来自VMware提供的VMware Tools。对比故障虚拟机和升级更新后正常启动虚拟机的VMware Tools版本,发现故障机的VMware Tools版本偏低。因此,先升级VMware Tools版本再安装2023年7月的更新包(KB5028168),经测试故障解除。
原因分析
这2台故障机因为平时非常稳定较少维护、很少重启,导致其VMware Tools也没有及时更新,系统的驱动与KB5028168更新包不兼容。
总结
1.升级Windows Server 2019的2023年7月更新包(KB5028168)前建议先进行备份。
2.VMware vSphere不可忽视VMware Tools的升级更新。
3.核心系统如数据库,不建议设置自动更新,一旦出现此类问题,隐患较大。
4.本次故障的虚拟机为应用服务器、未包含业务数据,通过备份可以恢复,故未深究如何修复故障虚拟机。