公司exchange2013架构为双站点多副本模式,实现2地3中心容灾环境;具体架构如下Exchange2013 邮箱服务器故障排查-warning  was 5139_exchange2013故障现象:
早上接一个用户反馈重启电脑后outlook无法连接服务器Exchange2013 邮箱服务器故障排查-warning  was 5139_邮箱报错_02

1、接报障后,查看个人邮箱登录正常,重试用户重启电脑后,仍然能登录outlook,初步怀疑是个人电脑问题(如网络、个人账户密码问题);远程用户电脑处理,发现owa输入密码后一直处于转圈状态(此次步骤已验证用户密码无问题)Exchange2013 邮箱服务器故障排查-warning  was 5139_邮箱报错_03
2、经过上述步骤排查后,可确认为服务器故障,但本人用户正常,初步估计故障问题发生在CAS或者DAG服务器上;查看本人与故障用户的邮箱分别处于不同DAG;为快速解决用户问题,先将用户的邮箱迁移到其他DAG的DB上,同时排查故障用户的所处DB的主活动服务器;(迁移完成后,用户正常登录,进一步确认故障点在DAG服务器上;PS:该DB上暂未有其他用户反馈)
3、登录的MBS服务器,查看系统日志,发现应用进程池报错,应用程序日志Exchange2013 邮箱服务器故障排查-warning  was 5139_exchange2013_04Exchange2013 邮箱服务器故障排查-warning  was 5139_exchange2013_05
4、发现DB上的主mbs出现上述故障后,其他服务器未出现问题,先将DB激活到其他服务器上,将该问题服务器的DB处于数据库副本状态;使用命令get-serverhealth mbsname查看报错服务器;出现Exchange2013 邮箱服务器故障排查-warning  was 5139_IIS_06
结合应用程序报错,可确认该服务器IIS出现故障
5、结合去年年度补丁更新时,出现过该问题,当初未打10月补丁出现,卸载10月补丁后,iis正常(PS:补丁更新这么久了为何现在才出现保障),找到补丁KB 5031407后进行卸载,重新启动后,发现报错消失;使用命令get-serverhealth命令查看到处于health状态,get-servercomponentstat查看到组件都处于true状态,test-servicehealth测试服务正常,test-replicationhealth数据库复制状态正常,创建一个本地DB,将其中一个测试邮箱迁移至该DB上,test-mailflow正常,test-mapiconnectivity正常,owa和outlook登录都正常,至此问题处理完成。

思考点:
1、10月份打完补丁,当时测试验证邮箱都能正常登录,为何现在才出现问题?
2、其他服务器也打了该补丁,为何没有问题?