容灾建设的目的是确保用户的业务永续运行,在建设过程中,科学严谨的方法论是确保容灾项目能够正常运转的前提。我们将容灾建设规划分为三部分:业务连续性规划、方案设计、方案实施。
1.业务连续性规划
容灾建设通常会根据业务连续性规划来确定方案,其目的是为了保护业务的连续性运行。因此,业务连续性规划是进行灾备建设的基础和前提,只有进行了业务连续性规划,容灾建设才有实际的意义,当进行容灾规划的时候,必须考虑风险分析和业务影响分析这两个方面。
风险分析:根据自身的实际情况,企业一般要预先确定IT运行环境中存在哪些隐患,一般会产生什么灾难情况,诸如不可接受的物理威胁或者可能发生的灾难,并对灾难会发生的可能性、预防灾难发生时候的措施的有效性,以及该灾难发生后,能够产生威胁的资产价值进行分析,最后获取到需要防范的风险情况,以及其风险优先级情况。
业务影响分析:通过和各个业务部门的相关人员的沟通,了解各业务的商业价值。当灾难发生,学会评估该灾难对各业务的影响情况,比如对于系统对外服务的用户的使用影响,由于灾难会造成的商业价值损失上的影响等。
2.方案设计
根据灾难分析阶段的综合评估,以及考虑企业能够在灾备上所能提供的投入,制订企业短期、长期时间范围内的灾备策略和方案,调整企业本身的人员组成和组织架构来适应策略要求。制订出灾备的具体实施方案是本阶段最为关键的。
可供选择的灾备方案通常很多,灾备方案主要考虑的因素包括系统恢复时间、实施与维护灾备策略所需的资金投入等。一般来说,要求的灾备恢复时间越短,那么该灾备方案所需的实施成本就越高,因此实施难度也就越大。
3.方案实施
通过在异地建立一套与本地生产系统完全相同的备份应用系统,在意外突发事件或灾难发生的情况下,可以迅速切换到异地的备份应用系统,接管业务的正常运行,保持对外服务的可用性。在建立容灾系统时,还要同时建立好多层次的广域网络故障切换机制。作为一个本地的高可用系统,当多个服务器运行一个或多种应用的情况下,应确保任意服务器出现任何故障时,都有从属服务器或者副本进行保障,使得运行的应用继续运行。系统和应用程序应该拥有热备份,出现故障的第一时间就能够迅速切换到其它服务器上运行。
综上所述,建议两地三中心的总体架构如下:
(1)以异地灾备架构为基础,在距主生产中心100km以内的地方设立同城中心,除数据库外其余组件架构一致,日常情况下可同时分担业务及管理系统的运行,并可切换运行,达到同城双活。
(2)为了减少业务延时,同城中心之间需采用裸光纤互联。
(3)每个业务都会分配到不同的数据中心,每个数据中心都有自己的应用集群对外服务或者跨同城生产中心建立共享的资源访问方式。
(4)同城中心之间数据库采用基于存储的同城磁盘同步复制的方式,实现同城双活;异地中心采用主库向异地中心异步复制的方式同步,实现异地备份容灾。
异地灾备的总体架构如下:
(1)部署GSLB,处理外部流量的双活:
部署GSLB,提供对外部访问的负载均衡能力,允许外部访问流量被分流到双活的中心;
GSLB和各中心内的SLB负载均衡做状态关联,当中心内应用服务器故障或性能下降时,能够通过GSLB把流量引导到应用服务器状态良好的中心;
(2)部署SLB,提供高可用和高性能:
应用服务器和数据无关,无需跨中心关联;
各中心内应用服务器独立执行业务处理,通过SLB提高中心内应用服务器的可用性和性能;
(3)部署DB服务器的主备集群:
跨中心部署DB服务器的主备集群,DB需要跨中心实现二层互联;
不同中心对数据库的访问,统一由主数据库服务处理;
原文链接:移动云开发者社区