<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

 

<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />712,在线旅行服务提供商艺龙旅行网出现服务中断,又是一场宕机梦魇

 

艺龙首席执行官崔广福在其微博中向所有客户致歉:“从12日下午两点开始,艺龙的存储系统出现故障,导致全部服务中断,访问艺龙的数十万用户失望而归。不能向客户和合作伙伴提供服务让我们心急如焚。我向所有受到影响的客户和合作伙伴郑重道歉!”这条微博在不到两天的时间内被转发524次,有评论254条。记者之后持续关注崔广福博客的更新,发现前后经过近20多个小时,艺龙网站的服务才完全恢复。14日上午,记者再次访问艺龙网站,发现一切访问正常。

 

从“9·11”事件开始,人们才真正意识到防灾的重要性。容灾的概念也就是从那时起才逐渐被中国的政府部门以及一些大型企业所接受。这之后,全球各地接连不断发生的地震、火灾、水灾等重大灾难事件一次次给人们敲响警钟:容灾刻不容缓。但是,是不是只有像地震、火灾这样的大灾大难才值得防御?艺龙的例子告诉我们,事实并非如此。随着企业对IT系统的依赖性越来越强,IT系统一旦宕机,对企业的信誉和经济利益都会造成重要的影响。而导致系统宕机的原因很多,除了概率极小的大灾大难以外,更多的灾难是由人为误操作、软件错误、存储系统故障,甚至是硬盘的故障引起的。这些出现概率相对较大的小灾小难才是企业最应该防范的。

 

随着技术的不断进步,虚拟化、CDP(持续数据保护)等技术被用于容灾,无论是系统的本地快速恢复,还是远程灾难恢复,实现起来都变得比人们想像中要更容易、更经济。对于大多数的企业来说,实现容灾保护的第一步是要转变观念。容灾是不是可有可无?是实现本地恢复还是远程恢复?是防大灾大难,还是防小灾小难?不同的需求决定了客户最终选择的容灾方案的成本、实施难度等。

 

为完善数据中心和灾备系统,艺龙通过微博撒下了英雄帖,邀天下英才或者服务提供商为其数据中心系统构架、灾备方案及运维管理会诊,并留下了艺龙首席技术官的电子邮件。看来,这场血的教训让艺龙彻底警醒了。那么其他的企业用户呢?是像艺龙一样等着系统出故障以后再亡羊补牢,还是现在就开始核查自己的系统,为数据中心买上一份“保险”呢?

 

有人在微博中发起了一项调查:艺龙网服务器宕机20多个小时,你还会用艺龙吗?截至14日下午1时,45%的投票者表示,仍然会选择艺龙网的服务,只有11%的投票者表示不会用。对很多个人用户来说,提供在线旅行服务的服务商很多,他们可以有更多的选择,因此对于一次服务中断,大多数人表示了谅解。不过,如果是企业用户,它们将IT业务,其中可能还包括一些核心业务,外包给公共云服务提供商,一旦公共云服务平台宕机,那么这些企业用户就有可能遭受灭顶,严重的可能会就此倒闭。因此,现阶段很多人一提起公共云服务,最关注的还是安全性的问题。

 

但愿您的企业不会重演宕机的梦魇。