案例二:重大附属Veritas高可用及容灾解决方案

案例二:重大附属高可用及容灾

一、项目背景

    医疗行业的信息化建设经过了几个阶段的发展,逐渐形成了HISLISRIS以及PACS等众多内容丰富、功能强大的应用软件。随着应用软件的运行时间逐渐延长,功能逐步增强,医院的数据的价值越来越大,系统一旦停机的损失也越来越大。

另一方面,随着“9.11”等事件的爆发,“容灾”这个词汇逐渐成为人们谈论最多的焦点之一。医疗行业的工作人员和就医者都十分关心医院的系统高可用性和容灾性。

重庆医科大学附属第一医院作为重庆市规模最大的医院之一,同时也是当地增长最快的医院,在西南地区,乃至全国都具有相当的影响力。

医院在信息系统建设方面非常重视。随着全国医疗信息化的不断展开,重庆医科大学附属第一医院作了多方面的深入调查,同时对自己的信息系统建设也提出了相当高的要求。在基础平台建设方面,经过与VERITAS工程师详细的调研,针对该医院在系统可用性和容灾等方面的高要求,提出了完善的高可用及容灾系统的解决方案。

二、需求分析

   医院信息系统是一个数据量大,数据类型复杂和事务并发多的实时系统,由于医院业务的特殊性,任何人为或自然因素所导致的应用或系统中断,都会造成医院巨大的经济和名誉损伤及严重的法律后果,所以医院信息系统应该是具有防止单点故障的高可用系统,数据能够得到完善的保护,并且数据中心还需具备应对灾难发生的能力等,重医附院的信息化系统建设将围绕这些需求来建设。

   在目前已经上线的医院中,绝大多数医院都采用了群集技术(也就是通常人们所说的“双机热备份”)来保证服务的持续运行或者在用户可以容忍的时间之内自动进行服务恢复,群集技术在应对服务器故障方面有着显而易见的效果,这一技术已经得到大多数用户的认可并已经得到很大程度上的普及。

但是,随着群集技术运用的普及,很多用户发现群集本身也有一些非常明显的不足:

1. 由于传统的群集解决方案多采用“2+1”的模式,这个为了在两台服务器之间共享数据存储而存在的独立磁盘阵列往往就成为了核心系统的一个单点故障点,一旦磁盘阵列发生故障,则整个系统将发生停机,作为7×24营业的医院来说,这种意外的停机是无法忍受的;

2. 很多用户往往有这样的误解——既然我的系统已经是“双机热备份”了,那么,我的数据也不需要备份了。正因为有这样的误解存在,很多用户往往忽视了数据备份的重要性,整个系统只有磁盘阵列中的一份数据,等到由于磁盘阵列发生故障导致数据丢失的时候,才发现悔之晚矣!

3. 目前国内的医院用户大多数还没有认识到“容灾”的必要性,系统建设的时候,对数据和应用的容灾考虑得非常少,一旦发生火灾、地震等灾难性事故,整个系统将毁于一旦,数据将一去不复返,医院将遭受无法估量的巨大损失。

由于医院通常都没有与大型企业类似的各地分支机构,往往就是集中在一个园区之内,所以要为医院特地构建一个容灾中心对医院来说其实很不容易。有一些专业的ISP可以为企业用户提供数据容灾的服务,但对医院来说有两个比较明显的劣势:

1. 收费非常昂贵;

2. 只能解决数据的容灾,由于医院的应用基本上都集中在医院园区内部并对网络带宽要求较高,所以很难解决应用的高可用问题。

ISP的容灾服务更适合网站类型的企业应用,而不适合医院的应用。

综合以上需求分析,医院系统应该建立的是一套能够回避任何单点故障的高可用系统,且该系统具有强大的数据保护和容灾功能。

三、解决方案

    为了区别于以前的群集模式,我们把这个方案通俗地称为“2+2”群集模式,从功能上来讲,该方案历史性地突破了系统全冗余、无任何单点故障点以及数据和应用的园区范围的容灾,使用户的系统真正没有后顾之忧。

在原来的“2+1”群集模式的基础上,增加了一台磁盘阵列,将一台服务器定义为一个“运算节点”,将一台磁盘阵列定义为一个“存储节点”,所谓“2+2”的意思就是“两个运算节点+两个存储节点”。

    采用Veritas Volume Manager实现了两台磁盘阵列之间的镜像关系,每一次I/O的写入都分别通过两条主机通道到达两台磁盘阵列的控制器,并当两个I/O都返回正确的结果之后,操作才算完成。所以,两台磁盘阵列中的数据完全保持实时同步,不用担心任何的数据一致性问题。当然由于我们采用的是同步传输的方式,两个节点之间的距离不能相隔太远,建议的最远距离为50公里,如果超过50公里的距离限制,将会明显地影响业务系统的运行性能。对于超过50公里的距离限制的容灾要求,我们建议采用Veritas Volume Replicator做异步方式的传输,异步方式不会造成在线业务系统性能的下降。不过50公里这个距离限制对于医院的园区级别的容在要求是完全能够满足的。

    采用Veritas Cluster Server实现了两个运算节点之间的群集关系。除了实现基本的群集功能之外,Veritas Cluster Server还有很多非常明显的优势,如:

最多支持32个节点的超大规模群集、简单易行的节点退出和加入操作、跨平台管理群集服务器系统以及与Veritas Volume Manager天然的兼容性等等。

    如此,对于一个应用来说,只要任意一个运算节点和一个存储节点运行正常,那么,整个系统就能够正常运行。

以下是该解决方案的几个显著的优势:

1. 全冗余连接,无任何单点故障点。系统中任意一个部件的损坏都不会影响系统的正常运行;

2. 镜像的存储节点为系统关键的在线业务数据提供了双重保护;

3. 结合综合布线系统实现了数据和应用的容灾;

4. 除了以上几点特有的优势之外,由于我们的解决方案采用了先进的SAN架构,同样具有SAN架构自身的优势,如:我们实现了高性能的LAN-free备份以及良好的可扩展性等等。

本方案的逻辑架构图如下所示:

结合综合布线的变化,我们可以将两个节点分别部署在园区内不同的建筑内,如门诊楼和住院楼,如此,即使其中一栋楼发生灾难性的事故(如火灾等),医院的应用仍然能够继续正常运行,也不会有任何数据丢失的情况发生。如下图所示:

当然,整个方案的架构也具有非常好的可扩展性,不仅可以“2+2”,我们还可以做到“N+2”,甚至“N+N”,如下图所示:

四、应用效果

   本方案充分考虑了故障发生的可能性,为重医附院的信息系统提供了最大程度的数据保护和系统的高可用,,该方案不仅是完全的无单点故障系统,同时也具备很强的容灾功能。该系统建成后,至今运行良好,为重医附院的日常业务提供了可靠的保障,彻底消除了医疗信息系统管理人员的后顾之忧。

   重医附院的用户对该系统也给予了很高的评价:

医院的雷院长说:“……我认为我们应该直接实现‘2+2’的模式!”

医院信息科王主任说:“我们以前也采用群集技术来提高服务器的可用性,但磁盘阵列的单点故障始终令我非常担心,一旦磁盘阵列发生故障,我们医院的系统就会突然停机,医院的损失是无法估量的,信息科的压力也非常巨大;现在实现了‘2+2’模式之后,我们真的可以高枕无忧了!数据的安全性、系统的持续运行、系统管理的简单易行,这是我所感受到的切身体会!”

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11134849/viewspace-612382/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/11134849/viewspace-612382/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值