来源:HIT专家网 整理:小虫
编者按:
五一劳动节,本是休息的日子。HIT专家网微信群的医院信息科主任们却围绕一个HIS双机热备及服务器宕机后的切换问题,展开了深入的讨论,其实质是如何确保医院信息系统的业务连续性。多位主任给出了他们的实战体会,从中也可看出医院基础架构选型的走向变化端倪。
赵京湘 16:04
请教:哪个医院的HIS系统做到了双机热备?是否能实现毫秒级的切换?如果HIS的服务器(SUN小机)发生故障,最短的切换时间是多少?还有,有必要两套存储吗?两个服务器设置时间相差两个小时。
信笔 16:09
现在三级医院上系统时间比较长的,基本都是双机备份了吧。
赵京湘 16:10
切换花了一个小时。
信笔 16:10
这个时间比较差了。
湘里乡亲 16:15
而且因为两台服务器时间差两个小时,导致切换后数据对不上,说是切换就会有延迟,所以时间设的不一样。请问,这有道理吗?
吴杰 16:53
我们做应用服务器集群,数据库active-standby,两库用同一套数据文件,数据库坏了可以即时切换(自动漂移)。
赵京湘 16:55
那存储是一套还是两套?
吴杰 16:56
再配上数据库实时发布到另一台备份服务器,如果是存储坏了可以用1-2小时手工恢复文件。这时启动单机版收费。备份服务器兼作病人查询服务器。
湘里乡亲 16:56
不是数据库坏了,是小机主板坏了。
吴杰 16:56
存储是一套。对,主板坏了仍是数据库服务器不工作吧。上次还听工程师说老鼠把线路咬断了。
信笔 16:59
@吴杰 这个有可能,特别是水平布线不规范或临时布线时可能被老鼠咬,以前发生过。
吴杰 17:00
得在线路上撒老鼠药,这是安全防护的一部分[呲牙]
信笔 17:02
@吴杰 一般如果用规范的线管或线槽,遭老鼠的可能几乎没有。
饮水栖衡 17:02
还有的说法是系统中毒了,反正里外里都是说外因。
湘里乡亲 17:02
目前的技术,我们能承诺的业务中断时间可以在一年一小时之内吗?
吴杰 17:03
@湘里湘亲 可以吧,只要硬件够。
信笔 17:04
@湘里乡亲 7×24小时,每年停机小于1小时是允许的
饮水栖衡 17:05
甲方乙方利益不同,有合作也有对立,所以首先自己要明白,才能防止被乙方忽悠。@信笔
湘里乡亲 17:05
硬件都是新买的,相当够。
饮水栖衡 17:07
硬件其实没那么可靠,如果赶上寸劲儿,可能会出现多次问题。2002年做过his双机热备,硬件软件都出过问题,但还是以硬件的为多。实际上看,双机热备可靠度不一定比非热备高。
湘里乡亲 17:12
硬件能干的事很多,可以做双机,冗余,灾备…反正我们能买的都买了。
饮水栖衡 17:14
安全系统配置过于繁琐,反而容易出安全事故。
湘里乡亲 17:14
倒是现在我觉得整个集成的方案,安全策略的制定,成了应该关注的向题了
饮水栖衡 17:14
没错。设备是基础,策略才是最重要的。很多时候,都是出了事故才明白的。出事故没啥可怕的。数年前,我们Pacs双机热备出现过因为网络原因频繁切换,最终酿成数据故障。后来干脆不自动双机了,这样反而可控……都是教训。
邝志光 17:23
我们做了,用美国容错服务器,很好。