企业多园区统一灾备建设最佳实践

一、多数据中心统一灾备趋势

随着国家“走出去”发展战略的实施以及“一带一路”国家级顶层合作倡议的发表,越来越多的企业加快发展步伐,分支机构快速扩张,企业业务遍布全国各地甚至全球。虽然,各行业已经通过数字化转型,进一步把组织架构及生产办公系统化、线上化、数字化,实现了各分支机构、各园区、各数据中心之间的互联互通以及业务流转,但是企业多数据中心的统一灾备保护已经成为困扰企业的重大问题。

而随着数字化转型进程的不断深入,数字化系统成为了企业组织的生产资料和生产工具,数字化系统就是企业组织的一条隐形生产线,数据丢失以及业务停摆的风险已经成为悬在企业头上的一把达摩克里斯之剑。

二、德赛西威汽车电子股份有限公司

德赛西威汽车电子股份有限公司是国际领先的移动出行科技公司之一,致力于成为出行变革的首选伙伴,专注于电子化和集成化的产品与技术,聚焦智能座舱、智能驾驶和网联服务三大领域的整合,为全球客户提供安全、舒适、高效的智慧出行解决方案。公司成立于1986年,目前市值近千亿,在成立的36年间,德赛西威持续践行“本土国际化”战略,以惠州为中心,在南京、成都、上海、深圳、台湾以及新加坡、欧洲、日本、美国分别设立研发分部和分支机构。

三、客户需求

数字时代的IT基础设施、数字化系统、网络安全及运维管理三个方面时刻面临着诸如主机故障、系统错误、逻辑错误、勒索病毒、误操作等各种挑战和风险,无论公司IT基础设施投资方面如何冗余和云化、如何持续投入强化网络安全建设、运维管理如何严谨都依然可能会发生安全事件,造成:数字化核心资产数据丢失、数字化时代的生产线IT业务系统停止服务。

鉴于德赛西威的业务系统的重要性和无时无刻面临的风险,德赛西威领导和专家对于构建有效的灾备系统提出如下需求:

  • 两异地数据中心互为主备

德赛西威目前在两个异地园区之间分布着多个机房,为了实现机房级故障恢复,保障单个园区出现机房云平台灾难、机房断电、机房火灾/水灾等灾难事故发生的情况下,异地园区机房可以快速拉起恢复业务,德赛西威需要在两个园区异地数据中心之间建设互为主备的灾备系统,满足RTO<1小时,RPO<1小时要求。

  • 数据不丢

由于数据中心存储的皆为德赛西威研发及生产的关键业务数据,一旦丢失将会影响整体研发生产进度,更为严重的是会影响公司形象声誉。因此德赛西威需要更精细的数据保护措施,需要对承载核心业务系统的Oracle RAC、MS SQL、MySQL等数据库进行微秒级别的CDP持续数据保护。

  • 业务少停

德赛西威作为整个汽车装配制造产业链中的重要一环,一旦ERP、OA、MES等业务系统发生故障,不仅会影响公司整体生产运转,更会影响整个汽车装配制造产业链的稳定性。因此,德赛西威需要更完善的业务连续性管理,需要具备业务整机快速恢复能力。同时,为确保灾备系统的有效性及数据备份的一致性,灾备产品及方案需要具备多样化数据验证能力以及自动化数据演练能力,确保备份数据的一致性以及容灾站点的可用性。

  • 简单易得

为了降低灾备体系对操作人员的技术门槛,赋能给德赛西威的运维工程师,让德赛西威具备自主的备份、验证、演练以及恢复的灾备建设全流程闭环能力,让容灾效果真正掌握在德赛西威信息科手中。因此,需要一套简单易得的灾备解决方案,可实现无关业务类型、无关主机类型,全web化操作,验证简单、演练简单、灾备重建简单。

四、建设方案

  • 通过在A数据中心以及B数据中心各部署一台科力锐新一代灾备一体机,实现对本地ERP、OA、MES、Oracle Rac 等应用系统和数据库的高效备份、极简验证演练、应用接管容灾、分钟级灾难恢复、秒级热备切换等功能。

  • 两地数据中心的灾备一体机通过专线进行数据实时同步,每个数据中心均可做到数据本地备份以及异地备份的双重保险。同时在数据传输上具备重传机制和断点续传能力,若链路抖动,数据同步可自动恢复传输并从中断时刻开始传输,无需全部重传。

  • 德赛西威两数据中心灾备系统互为主备,若某个数据中心发生文件或主机级别故障,可由本地灾备一体机应急接管恢复;若某个数据中心发生云平台故障或机房级别故障,可由异地数据中心灾备系统远程应急接管恢复。

五、客户收益

德赛西威汽车电子股份有限公司结合现在和未来业务发展的需要,选择了科力锐灾备建设方案。将应用和数据作为一个整体,实现了包含业务逻辑的应用级灾备;并通过两地数据中心互为主备的设计来切实降低RTO和提升RPO;同时可视化和极简的灾备管理与运维操作降低技术门槛,最终构建了备份、验证、演练、恢复的全流程闭环灾备能力。

  • 更精细化的备份

区别于传统的文件级备份,科力锐采用基于顺序IO的磁盘块级整机备份技术,实现对操作系统、业务系统、数据库等的全景式数据保护,每一次备份都是保留主机中数据最完整的状态,不仅减少了主机资源的浪费,顺序读也提高了备份速度,更为重要的是,可以对Oracle RAC、MS SQL集群等做到微秒级别的真CDP,确保德赛西威重要业务系统数据不丢。

  • 更简单的验证

验证是检验备份数据的可用性、一致性、有效性的唯一手段。科力锐为德赛西威客户提供文件验证、网页验证、虚拟机仿真验证等多种方式,实现简单、快速、极简操作的数据验证。同时,也可配置自动化数据验证策略,7*24小时保障备份数据的可用性、一致性以及有效性。

  • 更直观的演练

灾难演练是构建有效灾难应急处置能力的唯一方式,就像日常的防火演习、防震演习一样,灾备建设也需要通过灾难演练梳理灾难切换流程,明确灾难发生时人员组织协调、操作执行的具体步骤,从而提高德赛西威的组织应急能力。区别于传统的灾备演练需要协调基础架构厂商、应用厂商、灾备厂商等多方人员,搭建复杂的演练环境,费时费力。科力锐提供更直观的灾备演练方式,可一键执行演练操作,大屏监控演练过程。

  • 更快速的恢复

本地业务快速恢复

随着数字化转型的进一步加深,数字化系统已经成为了德赛西威的生产资料和生产工具,因此保障数字化业务系统的连续性尤为重要。科力锐灾备系统根据客户不同系统业务连续性的要求,为客户提供应急接管容灾、CDP热备容灾以及快速恢复容灾等多种容灾方式,满足客户秒级、分钟级、小时级的业务恢复需求。同时,科力锐应用级灾备解决方案内置丰富的硬件驱动库,通过虚拟PCI总线兼容技术,实现异构无缝恢复,降低容灾对硬件的依赖。

  • 灾难远程应急恢复

实际生产应用中,有时仅有本地保护方案是不够的,面对火灾、地震等灾害,在离生产中心一定距离之外建立容灾中心有其必要性。科力锐远程灾备方案,生产中心的生产数据在本地备份的同时,采用异步增量复制的方式,通过 IP 链路将数据复制到容灾中心进行备份,当生产中心发生整体性灾难时,此时位于生产中心的本地灾备一体机也处于不可用状态;因此,远程灾备中心的CDP快照点可用于远程快速恢复,确保将业务中断和数据破坏的损失降至最低。

六、发展趋势

未来,随着数字化转型的进一步深化以及企业多数据中心发展的趋势,对于多数据中心的统一数据保护和业务连续性建设的需求将会越来越多。科力锐基于“备份-验证-演练-恢复”的PDCA循环灾备系统建设理论框架,契合客户实际需求,为客户提供简单、易得、面向未来的产品及解决方案,保护每一个客户的IT系统服务连续性和数据安全,为客户提供更高质量的数据保护和更完善的业务连续性管理。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
灾备系统建设后的运维工作主要包括以下几个方面: 1. 监控和维护:在灾备系统建设后,需要建立完善的监控和维护机制,对系统进行实时监测,并对系统进行定期维护和保养,保证系统的稳定性和可靠性。 2. 数据备份和恢复:在灾备系统建设后,需要对系统进行定期的数据备份和恢复测试,以确保备份数据的完整性和可用性。同时,需要建立紧急数据恢复机制,在系统出现故障或灾害时,能够迅速恢复数据和系统功能。 3. 容灾演练:为了确保灾备系统的有效性和可靠性,需要定期进行容灾演练,模拟不同的灾害情况,测试系统的应急反应和恢复能力。通过容灾演练,可以及时发现系统存在的问题,并对系统进行改进和优化。 4. 安全管理:在灾备系统建设后,需要加强系统的安全管理,确保备份数据和系统功能的安全性。需要对系统进行安全漏洞扫描和修复,加强权限管理和访问控制,防止未经授权的访问和攻击事件。 5. 系统优化:在灾备系统建设后,需要对系统进行优化,提高系统的性能和稳定性。需要定期清理系统垃圾、优化系统配置和调整系统资源分配,以提高系统的运行效率和响应速度。 综上所述,灾备系统建设后的运维工作包括监控和维护、数据备份和恢复、容灾演练、安全管理和系统优化等多个方面。通过对系统进行全面的运维工作,可以保证灾备系统的可靠性和稳定性,提高系统的运行效率和响应速度,确保在系统出现故障或灾害时能够快速恢复和正常运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值