发生灾难时候正是云提供方表现的时候
我很确定每个优秀的云服务提供方都有恰当的灾难恢复计划,而且进行了测试,通过了验证,在站点发生故障时能够有其他资源继续为运营提供支持。但是如果我将要考虑一家云提供方的话,那么我想知道有哪些资源可用,它们是如何实现的,以及这对我和我的用户意味着什么。当我的公司在经历灾难时,我同样对云提供方将如何帮助我很感兴趣。
阅读服务水平协议
确实要花儿点时间阅读并理解云服务提供方所提供的服务水平协议。询问并走查相关场景确保你完全理解灾难由什么构成,灾难将如何影响服务水平协议以及灾难恢复事件的所有细节,包括是谁宣告了灾难,为最小化对用户的影响用到了哪些过程和技术,以及多长时间才能恢复服务。数小时的宕机可能看似无穷无尽,但是你的业务应该能够继续运营。如果你的业务达不到这个要求的话,那么云服务可能不是很适合你,但是业务不应该应对一天或数天的中断。你的账户可能拥有信贷权,但是恢复服务往往更加重要。
RPO
灾难意味着已经发生了不好的事情,当IT服务发生灾难时,通常意味着已经丢失了数据。确保你理解服务的RPO,这样就知道在发生灾难时可能会丢失多少数据了。
RTO
在所有利益攸关的人面前公布RTO,确保所有的人都理解并同意这个值。当云服务提供方在经历灾难时,应该能够在RTO所指定的时间内恢复服务。你的老板向你大吼大叫,给云服务提供方打电话责令他们更快地恢复服务起不到任何效果。所以要确保每个人都了解服务恢复正常需要花费多长时间。
灾难恢复测试
越来越多的服务提供方提供多租户服务,但是这并不意味着用户会对灾难恢复进行测试,也不会发生流程合作这样的事。查看灾难恢复测试计划及结果,确保充分考虑了内部和外部职责。你可能必须要调整灾难恢复计划,在服务提供方的限制之内对灾难恢复计划进行测试。在提交给云服务提供方之前要知道这可能会影响审计,认证或者是与用户的合同义务。
云计算具有为公司节省大量IT预算的潜力,而且能够提供公司自身并不能实现的服务。全面理解云服务提供方的灾难恢复是如何运转的将为成功的应用提供保证,而且灾难恢复能够以最小的代价恢复服务的正常运营。
原文发布时间为:2011-12-15
本文作者:唐蓉
本文来自云栖社区合作伙伴IT168,了解相关信息可以关注IT168。