【云快讯】《“云计算”也要防雷,20%数据中心故障和雷击有关》

39 篇文章 0 订阅
20 篇文章 0 订阅


2015-08-24  张晓东  东方云洞察

点击上面的链接文字,可以快速关注“东方云洞察”公众号



上周四,比利时布鲁塞尔西南郊的St.Ghislaina小镇遭遇了雷电天气。结果,Google位于该镇的数据中心所存储的数据,遭到了“严重”的损失。大约百分之0.000001的数据受到了影响。




看起来这么小比例的数据量丢失媒体有点小题大做,不过谁让谷歌是全球互联网界的宠儿呢,也是云计算领域的先驱。 因为,雷电等原因导致数据中心的数据丢失,对于谷歌号称永不丢失的数据而言实在是一个教训。


Google的数据中心架构工作人员正在着手解决这个问题。目前,大部分的服务器已经使用更换了具备更好抗灾性的存储硬件。另外,Google也重申,Google云服务的弹性计算架构遍布全球各地,用户可以设定在灾难发生时自动切换到备用的弹性架构上。目前,Google Compute Engine在全球共有三个云计算数据中心,分别位于比利时、台湾的彰化和美国的爱荷华州。


闪电击中了数据中心所用的电网,导致主要电力系统供电中断。数据中心随即切换到了两种备用系统:备用供电线路和服务器内置电池。一般来说,两种灾备方案对于数据中心肯定是够了,但谁曾想到,内置的电池这次出现了问题。


根据Google透露的情况,在从上周四到昨天的时间里,由于部分数据中心服务器的电池耗尽时间太长(extended or repeated battery drain),这些涉事服务器存储的I/O出现了零星的存取失败情况:大约百分之0.000001的数据受到了影响。


这些服务器位于Google Compute Engine的北欧区域的europe-west1-b,受影响的服务器在该数据中心比例约为5%。虽然看起来数据损失比例极小,但对于拥有海量数据的Google来说,本次数据损失并不是一件小事……行业人士估计,Google拥有10-15 exabyte(EB)的数据,每exabyte等于100万TB,而每TB等于1000GB。如果把这个数字带入到计算里,百分之0.000001大约等于100多GB的数据。当然,Google虽然没有公布比利时数据中心的数据存储量具体有多少,但我们可以估计,至少有数GB到数十GB的数据,在本次雷暴中丢失。



这一事件之后,谷歌的工程师们对该公司的数据中心技术进行了“广泛的审查”,包括电气分布等发现了一些需要改进的领域。它们包括升级硬件以提高,在断电瞬间高速缓存数据保存能力,”以及“改善系统工程师的响应程序和能力”。


谷歌并不是独自面对这个问题。在2011年亚马逊在爱尔兰数据中心也早到了终端。


谷歌称其可靠性和准备是不可想象的,包括地震、甚至公共健康危机,“假设人和服务不可用长达30天。”(这是一个流行的做法。)


经此一事,说明谷歌还需要在数据中心方案方面有更多的改进,以保证将来做得更好。



扫描二维码关注【东方云洞察】公众号

实时了解深度的公有云市场分析和洞察结果!点击右上角,在弹出的菜单中发送给朋友、分享到朋友圈。请在公众号搜索并关注:DongCloudInsight 或 东方云洞察。需要点对点交流请加微信:jackyzhang523


帮助您了解公有云相关的深度洞察结果。带来极具深度和最新鲜的:云市场分析、云机会洞察分析、云重大事件快评、云杂谈、云论坛资讯,以及公有云领域最高端的CEO面对面深度研讨。

--- 最专注、专业的“公有云洞察”分享;关注全球,聚焦中国。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值