<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />3.4.1 重庆医科大学附属医院高可用及容灾系统<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

一、项目背景

医疗行业的信息化建设经过了几个阶段的发展,逐渐形成了 HIS LIS RIS 以及 PACS 等众多内容丰富、功能强大的应用软件。随着应用软件的运行时间逐渐延长,功能逐步增强,医院的数据的价值越来越大,系统一旦停机的损失也越来越大。

另一方面,随着“ 9.11 ”等事件的爆发,“容灾”这个词汇逐渐成为人们谈论最多的焦点之一。医疗行业的工作人员和就医者都十分关心医院的系统高可用性和容灾性。

重庆医科大学附属第一医院作为重庆市规模最大的医院之一,同时也是当地增长最快的医院,在西南地区,乃至全国都具有相当的影响力。

医院在信息系统建设方面非常重视。随着全国医疗信息化的不断展开,重庆医科大学附属第一医院作了多方面的深入调查,同时对自己的信息系统建设也提出了相当高的要求。在基础平台建设方面,经过与 VERITAS 工程师详细的调研,针对该医院在系统可用性和容灾等方面的高要求,提出了完善的高可用及容灾系统的解决方案。

二、需求分析

医院信息系统是一个数据量大,数据类型复杂和事务并发多的实时系统,由于医院业务的特殊性,任何人为或自然因素所导致的应用或系统中断,都会造成医院巨大的经济和名誉损伤及严重的法律后果,所以医院信息系统应该是具有防止单点故障的高可用系统,数据能够得到完善的保护,并且数据中心还需具备应对灾难发生的能力等,重医附院的信息化系统建设将围绕这些需求来建设。

在目前已经上线的医院中,绝大多数医院都采用了群集技术(也就是通常人们所说的“双机热备份”)来保证服务的持续运行或者在用户可以容忍的时间之内自动进行服务恢复,群集技术在应对服务器故障方面有着显而易见的效果,这一技术已经得到大多数用户的认可并已经得到很大程度上的普及。

但是,随着群集技术运用的普及,很多用户发现群集本身也有一些非常明显的不足:

1.         由于传统的群集解决方案多采用“ 2+1 ”的模式,这个为了在两台服务器之间共享数据存储而存在的独立磁盘阵列往往就成为了核心系统的一个单点故障点,一旦磁盘阵列发生故障,则整个系统将发生停机,作为 7 × 24 营业的医院来说,这种意外的停机是无法忍受的;

2.         很多用户往往有这样的误解——既然我的系统已经是“双机热备份”了,那么,我的数据也不需要备份了。正因为有这样的误解存在,很多用户往往忽视了数据备份的重要性,整个系统只有磁盘阵列中的一份数据,等到由于磁盘阵列发生故障导致数据丢失的时候,才发现悔之晚矣!

3.         目前国内的医院用户大多数还没有认识到“容灾”的必要性,系统建设的时候,对数据和应用的容灾考虑得非常少,一旦发生火灾、地震等灾难性事故,整个系统将毁于一旦,数据将一去不复返,医院将遭受无法估量的巨大损失。

由于医院通常都没有与大型企业类似的各地分支机构,往往就是集中在一个园区之内,所以要为医院特地构建一个容灾中心对医院来说其实很不容易。有一些专业的 ISP 可以为企业用户提供数据容灾的服务,但对医院来说有两个比较明显的劣势:

1.         收费非常昂贵;

2.         只能解决数据的容灾,由于医院的应用基本上都集中在医院园区内部并对网络带宽要求较高,所以很难解决应用的高可用问题。

ISP 的容灾服务更适合网站类型的企业应用,而不适合医院的应用。

综合以上需求分析,医院系统应该建立的是一套能够回避任何单点故障的高可用系统,且该系统具有强大的数据保护和容灾功能。

三、解决方案

为了区别于以前的群集模式,我们把这个方案通俗地称为“ 2+2 ”群集模式,从功能上来讲,该方案历史性地突破了系统全冗余、无任何单点故障点以及数据和应用的园区范围的容灾,使用户的系统真正没有后顾之忧。

在原来的“ 2+1 ”群集模式的基础上,增加了一台磁盘阵列,将一台服务器定义为一个“运算节点”,将一台磁盘阵列定义为一个“存储节点”,所谓“ 2+2 ”的意思就是“两个运算节点 + 两个存储节点”。

采用 Veritas Volume Manager 实现了两台磁盘阵列之间的镜像关系,每一次 I/O 的写入都分别通过两条主机通道到达两台磁盘阵列的控制器,并当两个 I/O 都返回正确的结果之后,操作才算完成。所以,两台磁盘阵列中的数据完全保持实时同步,不用担心任何的数据一致性问题。当然由于我们采用的是同步传输的方式,两个节点之间的距离不能相隔太远,建议的最远距离为 50 公里 ,如果超过 50 公里 的距离限制,将会明显地影响业务系统的运行性能。对于超过 50 公里 的距离限制的容灾要求,我们建议采用 Veritas Volume Replicator 做异步方式的传输,异步方式不会造成在线业务系统性能的下降。不过 50 公里 这个距离限制对于医院的园区级别的容在要求是完全能够满足的。

采用 Veritas Cluster Server 实现了两个运算节点之间的群集关系。除了实现基本的群集功能之外, Veritas Cluster Server 还有很多非常明显的优势,如:

最多支持 32 个节点的超大规模群集、简单易行的节点退出和加入操作、跨平台管理群集服务器系统以及与 Veritas Volume Manager 天然的兼容性等等。

如此,对于一个应用来说,只要任意一个运算节点和一个存储节点运行正常,那么,整个系统就能够正常运行。

以下是该解决方案的几个显著的优势:

1.         全冗余连接,无任何单点故障点。系统中任意一个部件的损坏都不会影响系统的正常运行;

2.         镜像的存储节点为系统关键的在线业务数据提供了双重保护;

3.         结合综合布线系统实现了数据和应用的容灾;

4.         除了以上几点特有的优势之外,由于我们的解决方案采用了先进的 SAN 架构,同样具有 SAN 架构自身的优势,如:我们实现了高性能的 LAN-free 备份以及良好的可扩展性等等。

本方案的逻辑架构图如下所示:

 

结合综合布线的变化,我们可以将两个节点分别部署在园区内不同的建筑内,如门诊楼和住院楼,如此,即使其中一栋楼发生灾难性的事故(如火灾等),医院的应用仍然能够继续正常运行,也不会有任何数据丢失的情况发生。如下图所示:

 

当然,整个方案的架构也具有非常好的可扩展性,不仅可以“ 2+2 ”,我们还可以做到“ N+2 ”,甚至“ N+N ”,如下图所示:

 

四、应用效果

本方案充分考虑了故障发生的可能性,为重医附院的信息系统提供了最大程度的数据保护和系统的高可用,,该方案不仅是完全的无单点故障系统,同时也具备很强的容灾功能。该系统建成后,至今运行良好,为重医附院的日常业务提供了可靠的保障,彻底消除了医疗信息系统管理人员的后顾之忧。

重医附院的用户对该系统也给予了很高的评价:

医院的雷院长说:“……我认为我们应该直接实现‘ 2+2 ’的模式!”

医院信息科王主任说:“我们以前也采用群集技术来提高服务器的可用性,但磁盘阵列的单点故障始终令我非常担心,一旦磁盘阵列发生故障,我们医院的系统就会突然停机,医院的损失是无法估量的,信息科的压力也非常巨大;现在实现了‘ 2+2 ’模式之后,我们真的可以高枕无忧了!数据的安全性、系统的持续运行、系统管理的简单易行,这是我所感受到的切身体会!”


Storage Foundation 的配置报价大致分以下几个步骤:

1.  确定适合用户的产品包或组合

2.  确定每个产品所应该对应的 Tier 级别

3.  为客户的特别要求配置相应的 Option

 

注意:在任何情况下,客户必须为安装了 Storage Foundation 以及相应 Option 每台主机都购买 Licenses Symantec 不提供任何将多台主机共同打包成一个 Licenses 的销售方式

 

4.1 Storage Foundation 系列软件包介绍

Storage Foundation 在功能上分为标准版和 Enterprise 版两个版本,根据功能丰富程度的不同,其价格是不一样的

 

4.1.1 Storage Foundation for Windows标准版软件包:

该软件包含存储管理(卷管理)的基本功能,比如:逻辑磁盘管理、 RAID 功能、在线性能监控和性能优化等;基本上在本章节前面部分所陈述的功能都用该软件包满足,普遍适合客户信息系统运行在单机情况下企业级存储管理需求,在绝大部分时候,当企业没有特殊的需求时,向客户推荐该软件是合适的。

 

在此软件包的基础上,针对客户的一些特殊需求,我们还可以提供一些单独收费的 Option 供客户选择:

 

Dynamic MultiPathing Option 可以提供对冗余 SAN 结构的支持,比如客户在主机系统上使用双 HBA 卡,或在磁盘阵列上使用冗余的双控制器,以及在 SAN 网络中部署冗余链路等,没有这个选项, Storage Foundation 标准版软件包将无法支持上述客户要求

 

FlashSnap Option 可以为客户提供存储快照功能,该选项的价格比硬件设备厂商所提供的快照技术收费要便宜,且在功能上还要丰富许多,若客户考虑使用快照技术,则可以向客户推荐购买该选项

 

Cluster Option for Microsoft Cluster Server (MSCS) 可以提供对微软群集软件的支持,当客户将其信息服务系统由单机平台升级到双机群集系统时,则需要相应购买该模块,否则微软群集系统将无法正常工作

 

Volume Replicator Option 可以提供远程数据容灾功能,该功能会在后面章节中描述

 

4.1.2 Storage Foundation Enterprise

该软件包含 Storage Foundation 标准版所有功能,同时还包括除 Volume Replicator Option 之外的所有 Option 功能,该软件在价格上较单独购买标准版 +Option 的总体价格便宜,当客户的初始环境就需要支持多路径、快照、微软群集功能时,应直接向客户推荐购买 Storage Foundation Enterprise 以帮助客户节省采购成本

 

4.1.3 Storage Foundation 标准版升级至Storage Foundation Enterprise

Symantec 也提供灵活的方式,让客户在信息服务系统扩展的时候,也可以用合适的价格升级存储管理软件的功能,用户只需在原购标准版的基础上,继续购买 Enterprise Option ,就可以将标准版升级成为功能更强大的 Enterprise 版本。

 

4.2 Storage Foundation HA 系列软件包介绍

Storage Foundation HA 软件包由完整功能的 Storage Foundation Cluster Server 两大模块组成,它用于群集环境下的客户信息系统,在功能上同样分为标准版和 Enterprise 版两个版本,价格上也相应不同

 

4.2.1 Storage Foundation HA标准版软件包:

该软件包相当于 Storage Foundation 标准版和 Cluster Server 的功能集合,可以根据客户对存储的特殊需求为 HA 标准版配置和 Storage Foundation 一样的 Option 选件模块,配置方式和配置原则均和 2.7.1.1 节中描述的 Storage Foundation 标准版一样。

 

同时,在 Cluster Server 的标准包的基础上,可以根据客户的企业实际应用为客户配置相应的群集系统 Option

·   Application Agent for Microsoft Exchange 针对 Exchange Server 的群集系统

·   Database Agent for Microsoft SQL 针对 SQL Server 的群集系统

·   Database Agent for Oracle 针对 Oracle 的群集系统

另外,当客户需要实施容灾系统时,根据客户所使用的数据复制技术, Symantec 还提供以下选件供客户选择:

·   Hardware Replication Agent for EMC SRDF 客户使用 EMC SRDF 技术复制数据

·   Hardware Replication Agent for Hitachi TrueCopy 客户使用 HDS TrueCopy 技术复制数据

·   Hardware Replication Agent for IBM PPRC 客户使用 IBM PPRC 技术复制数据

·   Global Cluster Option 适用于客户所有容灾环境,可以提供远程应用系统的自动切换

 

4.2.2 Storage Foundation HA Enterprise

该软件包相当于 Storage Foundation Enterprise Cluster 的功能集合。

 

同时,在 Cluster Server 的标准包的基础上,可以根据客户的企业实际应用为客户配置相应的群集系统 Option

·   Application Agent for Microsoft Exchange 针对 Exchange Server 的群集系统

·   Database Agent for Microsoft SQL 针对 SQL Server 的群集系统

·   Database Agent for Oracle 针对 Oracle 的群集系统

 

另外,当客户需要实施容灾系统时,根据客户所使用的数据复制技术, Symantec 还提供以下选件供客户选择:

·   Hardware Replication Agent for EMC SRDF 客户使用 EMC SRDF 技术复制数据

·   Hardware Replication Agent for Hitachi TrueCopy 客户使用 HDS TrueCopy 技术复制数据

·   Hardware Replication Agent for IBM PPRC 客户使用 IBM PPRC 技术复制数据

·   Global Cluster Option 适用于客户所有容灾环境,可以提供远程应用系统的自动切换

 

 

4.3 Storage Foundation DR
for Windows

该软件包专为适应客户容灾环境而推出,当用户应用系统需要进行容灾设计时,为需要做容灾的每台主机系统配置该模块即可,该模块不需要其它选件,但针对运行在主机上的应用系统,你还需配置相应的 Option

 

·   Application Agent for Microsoft Exchange 针对 Exchange Server 的群集系统

·   Database Agent for Microsoft SQL 针对 SQL Server 的群集系统

·   Database Agent for Oracle 针对 Oracle 的群集系统

 

4.4 理解Storage Foundation软件系列的Tier

Tier 级别是软件的收费标准,同一软件在不同 Tier 级上的价格不一样, Storage Foundation Windows 产品家族按照 Windows 操作系统的版本分为三个级别:

 

       • Tier 1

       o Windows 2000 Server

       o Windows Server 2003 Standard Edition (32-Bit)

       o Windows Server 2003 Enterprise x64 Edition (64-bit)

       • Tier 2

       o Windows 2000 Advanced Server

       o Windows Server 2003 Enterprise Edition (32-Bit)

       o Windows Server 2003 Enterprise Edition with SP1 for Itanium-based Systems (64-bit)

       o Windows Server 2003 Enterprise x64 Edition (64-bit)

       • Tier 3

       o Windows 2000 Datacenter

       o Windows Server 2003 Datacenter Edition (32-Bit)

       o Windows Server 2003 Datacenter Edition with SP1 for Itanium-based Systems (64-bit)

       o Windows Server 2003 Datacenter x64 Edition (64-bit)