宁乡县人民医院现状
宁乡,治邑于三国,建县于北宋。隶属湖南省会长沙市,属长沙市西郊区,距长沙河西中心区仅30分钟车程,全国百强县排名第56位。
宁乡县人民医院在新大楼楼落成前,业务系统已经应用有Windows、小机、虚拟平台等异构平台,业务系统有HIS、PACS、OA、财务等系统,其中HIS为核心系统。众多应用部署率和部署规划各有不同,如何对医院现有应用系统进行科学合理并易于扩展的保护,这就对数据保护解决方案提出了非常高的要求。
医院计划在原大楼内设立灾备机房,将目前生产系统的核心数据容灾到灾备机房,以此作为契机,由爱数来给宁乡县人民医院规划双活数据中心。
核心系统:HIS生产机房为Oracle RAC集群架构,保障业务系统高可用,另外在灾备机房部署有Oracle Datagurd容灾架构,在生产机房两节点HIS服务器故障情况下,同样能够接管HIS业务,同时HIS生产数据实时复制到灾备机房存储内。另外,数据还通过TSM备份系统定时备份。
次级系统:PACS系统对业务连续性要求相对较低,但数据安全很重要,所以采用了复制软件,对生产数据的影像文件做定期迁移,复制到灾备机房存储内。另外,数据通过TSM备份系统定时备份。
其它系统:OA、财务、Web、合理用药、漏费控制等系统采用Windows 2008 Hyper-V虚拟平台,包括生产数据的整个业务环境以虚拟机方式存储在生产机房存储内,数据通过TSM备份系统定时备份。
宁乡县人民医院数据保护的问题和挑战
从目前业务系统现状分析,所以业务系统都已经做到了TSM集中备份,特点是HIS、PACS重要系统不管业务环境还是数据都进行了保护。但是,从目前部署图中可以看出,业务系统安全瓶颈集中在存储端,目前只做了数据定时备份,并没有对存储设备保护,如果出现存储数据逻辑或物理故障,对前端所以有连接的业务系统都有会直接影响。
所以在本方案中,我们将着重从“不停、不丢、可恢复”既“应用系统的不间断运行、业务数据不丢失、备份数据可恢复”三个方面来对我医院的整体信息系统安全建设进行阐述,使得新建的信息安全系统具有相当的容灾能力,从而更加有力的保证应用系统的正常运行。此外,需要增加服务器操作系统快速恢复措施,确保服务器系统的及时恢复。
根据之前与用户技术人员沟通,我们总结目前问题如下:
存储设备单点故障:业务系统存储设备存在单点故障问题,如果出现某存储设备故障,整个HIS或PACS系统都会当机,直接影响到业务正常运行,所以需要有效的存储链路冗余措施及兼容性保障存储设备间高可用;
数据实时性安全:HIS采用了存储自带的卷镜像功能,但是只有最新副本,无法恢复到历史副本,这样是没办法保护逻辑错误的。虽然有TSM备份系统做定时备份,但是是小时级别定时备份,意味着如果生产数据故障,有小时级别数据丢失的。像HIS、财务、OA等系统数据非常重要,不允许有业务数据丢失。所以备份系统能够达到实时备份;
结果有效性:现有的TSM备份系统没办法灵活验证备份结果,这对于数据安全管理是非常不合适的;当前经常需对HIS、LIS数据进行查询,需要备份系统具备演练机制,随时验证备份结果;保护全面性:现有的TSM备份系统无法全方位保护,目前备份还只针对数据库本身,与业务系统紧密相关的操作系统、应用程序、中间件等环境全面有效的保护;
远程容灾:对火灾、地震等自然灾害对生产机房数据造成的毁灭性破坏,没有有效保护措施,需对核心数据进行远程容灾保护。
AnyBackup 5.0 +爱数存储虚拟化容灾网关实现全面的RAC+虚拟化环境数据保护
该方案能够对现在我院信息系统环境做全网数据保护,具体按GX2000存储容灾网关+备份存储柜二套系统实现。GX2000存储容灾网关用于存储端容灾保护,备份存储柜用于主机端备份容灾保护。
目前在机房有台小机P550作为生产机房HIS Oracle RAC的Dataguard容灾节点。但是一直不好用。很难保障双节点RAC故障时能够成功接管。所以需要建议进行改造。
名称
描述
备注
RAC三节点集群
生产机房已经有两节点RAC环境,可以将异地机房Datagurad节点改造为第三个RAC节点
1.第三个节点可以分摊生产机房RAC双节点业务压力。
2.生产机房双节点故障时,HIS业务不会中断。(如:火灾、电源等大的灾难故障)
准备工作:
1.增加Oracle RAC节点授权
2.增加Oracle RAC部署及维保费用
演练机
第三节点RAC还可用于平时容灾数据演练环境。
演练过程需要将业务网络中断,RAC配置为单机模式。
实现效果:
技术改造技术要求
说明
爱数方案
对现有的小机RAC重新架构,确保三台小机之间的随时切换保证系统不间断工作
目前医院核心业务HIS系统为本地生产机房RAC高可用,异地容灾机房小机没利用好。需要将异地机房小机改造成RAC第三节点,当本地机房两台小机同时有故障时,异地机房小机照常工作,前端HIS核心业务系统不停。
1.扩展RAC节点(建议)
生产机房已经有两节点RAC环境,可以将异地机房Datagurad节点改造为第三个RAC节点
优点:
1.第三个节点可以分摊生产机房RAC双节点业务压力。
2.生产机房双节点故障时,HIS业务不会中断。(如:火灾、电源等大的灾难故障)
缺点:
1.增加Oracle RAC节点授权
2.增加Oracle RAC部署及维保费用
2.作为HIS演练机
取消Datagurad,保留HIS业务环境,用于平时容灾数据演练环境。
优点:
随时可以验证容灾结果,提升灾难事故响应能力
缺点:
生产机房双节点RAC故障,HIS业务会中断。需要手工干预恢复业务
对虚拟化平台进行接管,确保财务、OA等办公系统业务可以随时接管
目前OA、财务等系统在Hyper-V虚拟平台内,单机运行,需要有容灾机制保护,当生产节点故障时,容灾节点能够手工或自动接管业务
备份存储柜+外置容灾机对虚拟平台内OA、财务业务系统应用容灾保护,备份存储柜用于容灾任务管理控制台,外置容灾机用于容灾机的虚拟平台。
OA、财务业务环境应用容灾保护。不管某虚拟机故障或整个Hyper-V虚拟平台容灾机都能够接管业务。可以根据情况选择自动或手工确认接管。
全网数据(包括HIS、PACS、OA、财务、一卡通自助系统、WEB、合理用药等所有应用系统的文件、数据库和操作系统)进行定时或者实时备份,确保所有数据有多个历史时间点版本
完整业务系统由操作系统、应用业务程序、关联数据库组成。保护业务系统数据库的同时,需要对操作系统、应用业务程序进行定时备份。备份策略能够设置保留更长时间(年以上)历史版本。
备份存储柜对所有数据定时备份,可以保留长时间数据历史副本。包括操作系统、数据库、应用环境全面完整备份
数据逻辑故障:选择最新或历史数据副本恢复回来。
服务器物理故障:可以通过恢复操作系统、应用环境、数据库步骤,恢复搭建新的完整业务环境
实现生产机房HIS存储设备故障时灾备机房存储可以自动快速切换,保持系统业务不停顿
支持生产机房和容灾机房的不同品牌、不同规格型号等异构存储设备故障时自动切换
GX2000容灾网关对生产存储设备容灾保护。基于存储虚拟化技术,达到异构存储设备自动切换,业务不中断
RTO=0(设备故障或生产卷,容灾设备实时接管业务)
支持CDP逻辑回滚,非快照技术,确保数据可恢复到两周(14天)以内任意秒级的数据状态
支持不同品牌、规格型号等异构存储设备卷级同步复制,当出现数据逻辑错误,能够恢复到两周(14天)内任意秒级历史版本的数据状态
GX2000容灾网关基于存储虚拟化技术,内置CDP功能,数据逻辑故障,可以恢复14天内何意秒历史数据副本
RPO=0(生产数据故障或逻辑故障,能够恢复到故障时前一秒历史副本,保障数据不丢失)
支持异构存储扩容,确保存储容量不够时,可以随时在现有容量基础上扩充存储容量。
支持不同品牌、规格型号等异构存储设备空间整合、扩容,能够统一管规划管理存储空间,提高存储空间利用率。具备存储空间扩容的合理策略,不需要将现有存储进行更换
GX2000容灾网关基于存储虚拟化技术,可以很好利用用户现有的存储资源。
可以有效全面的兼容市场中主流的存储系统,如:HP、EMC、IBM、NetApp等等。
警示系统
系统局部出现故障及时自动切换的同时,有几种方式提醒系统管理员及时处理和排除所发生的故障。
GX2000及备份存储柜设备控制台支持邮箱通知功能,可配置过滤策略,将成功或失败信息自动邮件方式发送给管理员,提高管理员即时响应能力。控制台可以实时显示当前告警事件统计,系统日志使用不同的颜色标识。
警告方式:邮件通知、系统日志、声光报警等。
日志类型:日志记录按不同颜色显示严重程序的类别,包括错误、告警、信息三种类别。
小结
宁乡县人民医院是一个典型的快速发展的县级人民医院,架构复杂性不亚于地区级三甲医院的架构。通过此方案提升数据管理有效性与工作效率,同时确保核心业务数据不丢失和业务不中断,存储层高可用保护。有效管理与控制IT风险,从而增强医院运营风险控制。