有一个专门的容灾服务,跨region容灾,跨az容灾
也就是跨数据中心容灾,相当于双活,双向写入。
数据非常重要,错误删除数据,去其他公司,也不一定录用。去一个工作就职,公司会背景调查,看看你在原来的公司干了什么,为什么离职。因此数据安全非常重要,操作的时候要谨慎。
双活架构
主备数据中心之间一般有热备、冷备、双活三种备份方式。
热备
热备的情况下,只有主数据中心承担用户的业务,此时备数据中心对主数据中心进行实时的备份,当主数据中心挂掉以后,备数据中心可以自动接管主数据中心的业务,用户的业务不会中断,所以也感觉不到数据中心的切换。
冷备
冷备的情况下,也是只有主数据中心承担业务,但是备用数据中心不会对主数据中心进行实时备份,这时可能是周期性的进行备份或者干脆不进行备份,如果主数据中心挂掉了,用户的业务就会中断。
双活
双活是觉得备用数据中心只做备份太浪费了,所以让主备两个数据中心都同时承担用户的业务,此时,主备两个数据中心互为备份,并且进行实时备份。一般来说,主数据中心的负载可能会多一些,比如分担6070%的业务,备数据中心只分担40%30%的业务。
大家可以去看看“业务双活的部署”
*本地高可用与双活数据中心的区别?(考到)
1.二者使用场景不同。本地高可用是同数据中心或者机房级的容灾,双活数据中心是异地 进行的是区域级的容灾;
2.本地高可用可以使用HyperMirror+SmartVirtualization 实现,双活不可用;
3.多路径:本地高可用使用HyperMetro时,多路径软件设置为负载均衡,而双活配置本地站点优先;
4.双活需要 GSLB、SLB、本地高可用不需要;
5.双活需要考虑安全层、传输层等六个层次的双活,而本地高可用可以不用考虑网络层、传输层和安全层双活,需要考虑应用、计算、存储三个层面的双活(网络可以考虑,距离近不是重点)。
-
成本:因为要考虑其他三层的物理设备,双活成本较高
-
保护范围:本地高可用是数据中心内;双活范围,两个数据中心最远可以达到300KM
*本地高可用和主备区别
-
保护范围:本地只能数据中心内,主备可以同城或异地
-
存储层实现:本地高可用使用HyperMetro 主备使用存储设备的远程复制特性
-
RTO、RPO:本地高可用RTO和RPO理论上可以等于0 主备不一定
-
工作方式:本地高可用同时提供业务,主备只有主提供业务
-
负载均衡:主备无法实现负载均衡
*双活和主备区别
-
工作方式:双活同时提供业务,主备只有主提供业务
-
负载均衡:双活实现负载均衡 主备不可以
-
资源利用率:主备只能达到50%;因为主工作时,备不工作
-
RTO和RPO:双活可以理论上实现 RTO=0 RPO=0
-
实现方式:存储层,双活是Hypermetro 主备是同/异步远程复制
-
范围:异地主备可以> 3000KM
-
网络:双活需要打通业务网络 主备不需要打通
-
业务切换:双活可以实现灾难发生时自动切换站点,主备需要管理员手动拉起
*同步远程复制和异步远程复制的区别
同步远程复制和异步远程复制都可用于存储系统的容灾方案,实现数据的远程备份。两者的实现方式不同,并且应用于不同的业务场景。
实现方式
• 同步远程复制是对主LUN进行写操作的同时,将I/O写请求发送到从LUN,当主LUN和从LUN都返回写请求成功时,再返回主机I/O写请求成功,从而实现主LUN数据和从LUN数据的紧密同步。
• 异步远程复制是对主LUN进行写操作的同时,在主站点记录本次写操作所修改的数据,待主LUN返回写请求成功后,就返回主机写请求成功。再通过用户手动触发或根据用户设置的触发条件自动进行同步操作,保证主LUN和从LUN数据一致。
应用场景
• 由于同步远程复制对带宽和数据时延有极高的要求,因此同步远程复制主要应用于主设备和从设备相距较近的容灾场景,如同城容灾备份。
• 异步远程复制对带宽和数据时延的要求较低,因此异步远程复制适用于长距离或网络带宽有限情况下的容灾场景。
对象存储服务obs
一般把文件体积较大的文件,例如视频,音频,大的图片,ppt放在对象存储。
对象存储收费至少分三种
- 流量费用一般0.5元 1G
- 存储费用0.1元 1G 一个月
- 调用费用 10000次 1元
测试-存储容灾服务
现在对新加入的硬盘格式化
自动挂载
写数据进去
打开这个界面
创建站点复制对
这是跨可用区,先设置名称
生产站点是可用区1,灾备站点只能可用区2
第二步,部署云容灾的网关
现在还有同步复制和异步复制两种功能了
同步远程复制
主端主机给存储写数据的时候,主端存储立即复制数据到从端存储,从端存储写入数据后,反馈给主端存储,主端存储反馈给主端主机。完成写入过程。
缺点:数据写入的时延较大。写入数据卡顿很久。
现在可以做到了,灾难发生的时候,数据0丢失。但是不能做到业务0中断。
一般做到0丢失,成本需要100万,给客户报价的时候,要询问客户是否可以接受。
如果可以接受丢失30分钟的数据,成本只要70万。
如果接受丢失1小时的数据,成本只要50万。
存储特性对距离的要求
Hypermetro仅支持100km 内的容灾,25km以外需采用波分设备减少光衰减及链路复用降低 成本
同步远程复制仅支持200km 内的容灾
异步远程复制无距离要求,可根据距离配置合适同步周期
RPO、RTO
RPO 标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO 的值越小 RTO 标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO 的值越小
RPO、RTO是容灾的两个关键指标
RPO(Recovery Point Objective):即数据恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO 的值越小。
RTO(Recovery Time Objective):即恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。RTO 标志系统能够容忍的服务停止的最长时间。 系统服务的紧迫性要求越高,RTO的值越小。
RPO针对的是数据丢失,而RTO针对的是服务丢失,RTO和RPO的确定必须在进行风险分析 和业务影响分析后根据不同的业务需求确定。
<补充: RPO、RTO的单位都是时间 >
两地三中心有什么好处?
相对同城容灾,它可以应对区域级的灾难,具备更高的容灾能力;
相对异地容灾,在生产站点故障情况下,具备更小的 RPO或RTO。
什么是双活数据中心?
双活数据中心解决方案是指两个数据中心同时处于运行状态,同时承担业务,提高数据中心的整体服务能力和系统资源利用率。两个数据中心的数据实时保持一致,当单设备故障甚至一个数据中心故障时,业务自动切换,数据零丢失,业务零中断。
<关键点:
双活数据中心具备如下特点:
属于同城容灾方案
两数据中心同时对外提供业务
互为容灾、自动切换
数据零丢失、部分业务零中断(业务不中断不是必要标准)
创建保护组
加入保护的实例
现在新创建了一个主机,是灾备的主机
这个复制的主机不能开机的,只有保护的主机宕机了,才会启动,不然会出现数据写入错乱。
这就是跨AZ容灾,一个机器在可用区1,一个机器在可用区2
用的存储容灾服务 SDRS
测试写数据
这里的状态显示保护中,就是正常的,可以写数据试试看
这里有一个容灾演练
演练对主端没有任何影响
容灾演练,把从端主机做备份,把从端主机再复制一份再开机。
创建一个灾难演练的vpc,但是不能放在一个vpc
容灾的机器ip地址一样,不能放在一个vpc
这时候我们新创建一个vpc,两台机器就可以使用一个ip了
新创建了一个vpc
这时候又创建了一个云主机
原来帮助企业上云,一个项目几万块,企业上云也节约了不少钱,业务更加的稳定了。
这个主机可以开机,可以登录看看数据在不在
灾难演练完成后,需要删除这个主机
模拟真的坏的
主端没有故障,人工切换
一般如果不是双活,系统不会自动切换。以便自动切换发生数据丢失。
虽然可以一键式切换,但是需要有人在场。
大家看这个内网这个ip,也需要跟着修改,例如链接数据库,是内网连接的,切换主机后,内网ip不变,数据库无法连接了
机器都开始停机,开始切换
在容灾的管理界面,按开机
如何把ip也切换过去呢,因为绑定了弹性网卡,ip和mac地址都过去了
把故障主机的网卡解绑了,重新绑定在新的主机了
现在登录灾备主机,看看有没有数据
原主端恢复后,开启重保护
需要把故障期间改变的数据,重新同步到原主端
现在开始反向同步
两台主机都没有故障了,可以把数据重新切换过去