第八节 容灾技术

1、HA介绍

    HA通常使用共享存储,是指提供在本地系统单个组件故障情况下,能继续访问应用的能力,无论这个故障是业务流程、物理设施、IT软/硬件的故障;

    HA关键指标指可用性,计算公式[1-(宕机时间)/(宕机时间)+(运行时间)]

用“几个9”表示可用性,9越多宕机时间越短。

2、容灾简介

     灾难恢复(DisasterRecovery)是指当灾难破坏生产中心时在不同地点的数据中心内恢复数据、应用或者业务的能力。

     容灾是指,除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。

3、HA和DR的关系

维度

HA(Hight Availability)

DR(Disaster Recovery)

场景

HA 是指本地的高可用系统,表示在多个服务器运行一个或多种应用的情况下,应确保任意服务器出现任何故障时,其运行的应用不能中断,应用程序和系统应能迅速切换到其它服务器上运行,即本地系统集群和热备份。

DR 是指异地(同城或者异地)的高可用系统,表示在灾害发生时,数据、应用以及业务的恢复能力。

存储

HA 往往是用共享存储,因此往往不会有数据丢失(RPO=0),更多的是切换时间长度考虑即RTO。

异地灾备的数据灾备部分是使用数据复制,根据使用的不同数据复制技术(同步、异步),数据往往有损失导致 RPO >0;而异地的应用切换往往需要更长的时间,这样RTO>0。

故障

主要处理单组件的故障导致负载在集群内的服务器之间的切换

应对大规模的故障导致负载在数据中心之间做切换

网络

LAN尺度的任务是 HA的范畴

WAN 尺度的任务是DR的范围

HA 是一个云环境内保障业务持续性的机制

DR 是多个云环境间保淳业务持续性的机制

目标

HA 主要是保证业务高可用

DR 是保证数据可靠的基础上的业务可用

4、容灾系统的级别

级别

定义

RTO

TCO

数据级

通过建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。在数据级容灾方式下,所建立的异地容灾中心可以简单地把它理解应用是会中断的。 成一个远程的数据备份中心。在数据级容灾这个级别,发生灾难时数据级容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。数据源是一切关键性业务系统的生命源泉,因此数据级容灾必不可少。

RTO最长(若干天)因为灾难发生时,需要重新部署机器,利用备份数据恢复业务

最低

应用级

在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生,这样就使系统所提供的服务是完整的、可靠的和安全的。

RTO中等(若干小时)

中等,异地可以搭建一样的系统;或小些的系统

业务级

全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。其大部分内容是非IT系统 (如电话、办公地点等),当大灾难发生后,原有的办公场所都会受到破坏,除了数据和应用的恢复,更需要一个备份的工作场所能够正常的开展业务。

RTO最小(若干分钟或者秒)

最高

5、衡量容灾系统的关键指标RTO和RPO

RPO代表当灾难发生时允许丢失的数据量;RTO代表系统恢复的时间;

RPO与RTO越小,系统的可用性就越高,当然用户投资也高。

RTO应用恢复时间点(Recovery Time Objective)指灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。值越小表明业务中断时间越小。以应用为出发点能够容忍的应用系统恢复时间段;(是业务系统对容灾切换时间的要求)

RPO数据恢复时间点(Recovery Point Objective)指灾难发生后,系统和数据必须恢复到的时间点要求。值越小表明丢失的数据越少。以数据为出发点能够容忍的数据丢失量;

6、容灾的挑战和区别

应用多样,管理不便、流程复杂,耗时易错、黑盒运行,难以理解、

      一般所说的备份采用备份软件技术实现,而容灾通过复制或镜像软件实现;

  1. 两者的根本区别在于:

 ①备份软件处理后的数据格式不一致,必须恢复后才可使用;

 ②复制或镜像软件处理后的数据格式不发生变化,直接挂载给主机即可使用;

 ③两者的数据保护的周期不一致,复制或镜像的时间周期更短;

 ④一般备份为数据保护的最后一条防线,偏向于归档这个层面更多;

7、容灾主要技术
7.1、基于主机层容灾技术:

应用级的容灾技术:由应用软件来实现数据的远程复制和同步,当主中心失效时、密灾备份中心的空用软件系统恢复运行,接管主中心的业务。

数据库级的容灾技术,是针对于特定的数据库设计的容灾方案。典型数据库通常都具备数据库级容灾功能。例如:Oracle Data Guard、DB2 HADR等。数据库级容灾主要是通过传输数据库日志,并在灾备站点进行重放(Replay)来实现的。数据库级容灾技术自身可做到平滑切换。

基于逻辑碰盘卷的远程数据复制 是指根据需要将一个或者多个卷进行远程同步(或者异步)复制。该方案的实现 通常通过软件来实现。

7.2、基于网络层容灾技术:

基于 SAN 网络层的数据复制技术则是在前端应用服务器与后端存储系统之间的存储区域网络(SAN),加入存储网关,前端连接服务器主机,后端连接存储设备。

存储网关将在不同存储设备上的两个卷之间建立镜像关系,将写入主卷的数据同时写到备份卷中。当主存储设备发生故障时,业务将会切换到备用存储设备上,并启用备份卷,保证数据业务不中断。

7.3、基于阵列层容灾技术:

存储层容灾主要采用了阵列间的数据复制技术,将数据从本地阵列复制到灾备阵列,在灾备存储阵列产生一份可用的数据副本。当主阵列故障时,可以将业务快速切换到备用阵列,从而最大可能的保障业务的连续性。

8、SAN同步复制容灾

     部署方式见图,目标RPO=0,RTO分钟级。

     基于SAN的容灾复制才支持同步复制,建议100km以内。

     RD主要提供容灾管理功能,包括拓扑,容灾测试,演练和灾难恢复。

     进行应用管理和灾备应用恢复时,服务器上需要安装Agent

     RD管理网络需要跟主机,存储互通。

     支持FC/iSCSI链路,建议同步复制使用FC链路。

9、容灾方案
9.1、主备容灾方案

  支持容灾管理软件部署、调测一键式;

  支持容灾演练和切换一键式,协助完成定制脚本工具能力,协助您一键恢复备用业务系统

容灾模式

可靠性方案

灾备恢复

数据备份需求

双活

集群+负载均衡

自动

实时同步复制(<100 KM)

热备份

集群(cluster)

自动

实时同步复制(<100 KM)

暖备份

人工干预

手动

异步复制(>100 KM)

冷备份

人工强干预

手动

同上

9.2、两地三中心(3DC)容灾方案

    容灾建设周期短,交付风险低;异地容灾系统管理可视化;

    支持容灾管理软件的一键式可视化部署、调测;

    支持对生产中心、同城灾备、异地灾备中心设备的统一管理和监控,简化设备维护;

支持一键式容灾演练和切换,客户定制脚本一键恢复备用业务系统,简化灾备系统的管理和维护

9.3、双活容灾方案7*24小时在线

双活容灾去网关化,高效实施;业务级“A-A”高可靠,数据中心级故障业务不中断;

双活存储层无虚拟化网关,减少故障点,简化实施与调测;双活容灾服务经验丰富;

丰富的双活容灾实施经验、实现金融、政府、医疗等超过80+双活容灾项目;

业务不停机完成从双活方案到两地三中心方案设计与实施;

丰富的灾备实施经验,有力的专业服务工具支撑;

提升容灾方案实施效率,降低TCO达30%;

9.4、阵列复制容灾方案

应用场景:

支持一对一容灾或多对一集中容灾;

多分支机构数据独立存放,需要建立统一的容灾系统,对各个分支机构进行统一 容灾保护;

方案特点:支持多达31个分支机构;支持同步/异步复制方式,根据各个分支特点灵活选择;   

          统一管理各分支容灾存储系统;不同级别阵列可互通复制,降低TCO;

          支持灵活在线添加/撤除分支站点;结合快照功能,可实现数据的连续保护;

客户价值:容灾资源共享,节约投资;容灾中心维护和管理资源共享,节约维护和管理成本;

9.5、Oracle数据库容灾

  应用场景:采用Oracle数据库;需建立远程容灾;

  方案特点:本地高可用、异地容灾;全冗余架构设计;异构硬件兼容

  客户价值:对现网环境改造小、维护简单、基于Redo机制复制,对带宽要求低;

9.6、园区/同城应用级容灾 (物理机模式)

  应用场景:物理机模式(小型机、X86服务器)、两数据中心距离 <80KM;

  客户价值: 应用自动切换,快速恢复业务;为应用定制化开发切换脚本;

           支持应用类型广泛,并可根据客户需要;

  方案特点:实现本地高可用和异地应用级容灾;具有存储开放性,支持异构存储;

          集群节点可任意组合(集群内主机总数量<=64);

9.7、云主备数据级容灾实现方式

      生产中心与容灾中心独立部署云管理平台(两朵云)设置同步策略,定期远程复制生产中心的云管理数据和业务数据(VM)到容灾中心,用户在业务规划时,可根据实际需求,在存储上划分两种LUN:保护LUN和未保护LUN,将需要容灾的VM创建在保护LUN上,并只对保护LUN配置阵列复制,以节省容灾中心存储空间的需求,当生产中心发生故障时,容灾中心通过容灾管理软件一键式恢复虚拟机。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值