谷歌透露,其中一个谷歌云服务区最近遭遇了持续六小时的中断,原因是不间断电源未能正常工作。2025年4月2日下午办公高峰时段,腾讯会议大面积崩溃。在数字经济大时代,数字化技术及其所依托的数字基础设施起着举足轻重的作用,已经成为总体国家安全观的重要组成部分,数字化服务中断已经从过去给银行业带来灾难,演变到对各行各业带来深远影响。
电网断电时,不间断电源并未正常启动。
谷歌透露,其中一个谷歌云服务区最近遭遇了持续六小时的中断,原因是不间断电源未能正常工作。
这次中断始于 3 月 29 日,导致 us-east5-c 服务区内 20 多种谷歌云服务出现了“服务质量下降或不可用”的情况。
谷歌的美国东部服务区以俄亥俄州哥伦布市为中心。
谷歌的事故报告指出,这次中断始于“受影响服务区的市电中断”。
超大规模计算企业在搭建系统时为了应对这种情况,通常使用不间断电源(UPS),这种电源在电网断电时能够立即供电,并且在柴油发电机启动前持续供电数小时。
然而,谷歌的 UPS 遇到了“严重的电池故障”,未能提供任何电力。它们还似乎阻止了发电机提供的电力输送到谷歌的机架,工程师不得不绕过失效的 UPS,然后通过发电机恢复供电。
工程师们于太平洋时间 12 点 54 分接到事故警报,并在 14 点 49 分使发电机成功恢复供电。
事故报告指出:“大多数谷歌云服务随后很快恢复正常”,不过“少数几项服务的恢复时间较长,原因是在某些情况下需要手动操作才能完全恢复。”