公司,即使是大型公司,也没有像他们应该的那样定期考虑其主要云提供商拥有的基础设施之外的灾难恢复计划。今年 3 月,亚马逊网络服务 (AWS) 发生了大规模故障,直接影响了一些世界上最大的品牌,导致它们离线数小时。在这种情况下,这不是恶意攻击,但最终结果是一样的——中断。
当该组织的领导层向他们的 IT 部门询问这种中断是如何发生的时,大多数人都得到了一个可以接受的答案:是 AWS。亚马逊失败了,不是我们。但是,这个答案不应该被接受。
AWS 暗示它们是无懈可击的,但运行 IT 部门的人员运行它是有原因的。他们注定是怀疑者,他们的工作是建立冗余以保护系统免受任何一点故障的影响。其中一些公司使用 AWS 灾难恢复服务,但如果数据中心和所有需要在崩溃时启用故障保护的技术,那么你就失败了。这就是为什么我们需要使用与任何其他系统相同的逻辑来处理问题。如今