据悉,微软位于英国南部的数据中心设施内多个冷冻水泵因未知原因而关闭,因而导致Microsoft Azure云服务进入停机状态。微软目前已将设施内其余正在运行的部分设备进行关机处理,以阻止温度再进一步的上升。
Microsoft Azure在其博客上报告了事故原因,当前数据中心的多个冷冻水泵进行关闭操作时,发生了冷却失误事故,从而单个数据中心中某些部分的内部温度开始升高至了运行阈值以上,因此整栋数据中心设施自动化启动了网络关闭操作,以保护数据计算和存储资源的持久性。
现场工程师在事故发生以后已将冷却系统置于手动模式,并开始重置受影响的冷冻水泵设备。微软表示,这有助于将温度降低到数据中心所有受影响区域的安全操作范围。
一旦数据中心的温度处于安全阈值外,便会对于正在运行中的设备带来潜在的安全风险,例如温度过高会损坏服务器电路以及影响稳定性。
目前,微软的工程师已经开始恢复受影响基础架构的电源,并开始采用分阶段的方法使该基础架构恢复在线。一旦存储和网络基础架构完全恢复,相关的计算规模单位就会开始恢复,基于Microsoft Azure的虚拟机和其他依赖的服务也能得以重启。
据了解,英国政府的新冠疫情信息通报门户网站是受停机影响的用户之一。
来源:IDC圈