滴滴P0级事故始末,为何今年大厂崩得这么多

‍‍        

 4b8c3029ec9bdf0ae0024684843f5b7d.jpeg

35434a08e850ecb3e278b7faf5c46324.jpeg

语雀崩,阿里云崩,淘宝崩,咸鱼崩,钉钉崩...

这几天,滴滴崩了又上了热搜,不少打工人因为打不开滴滴导致上班迟到,错失航班等;

有网友反馈,滴滴打车车子未到,司机电话说到了。22:50 尝试访问,依然502,搜索失败,之后不断尝试...... 依旧是502错误。

eaac52341150e1e646e028ef4817af27.png

从员工的各方反馈看,本次滴滴系统崩溃属于全面瘫痪。不仅用户端无法正常使用,司机端以及滴滴内网同样出现了问题。

滴滴没有给出故障的具体原因,所以一些人猜测,故障是能是在底层的基础设施上。因为打车、共享单车等服务全面崩溃,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施。“攻击者一般只能访问到应用层,基础设施访问不到的。要么是被攻击者打穿,要么是自己系统操作不慎挂了。即便是前者,也算是一种系统缺陷,才会被打穿。”

同时,对于滴滴系统故障的原因也有其他各种猜测。有互联网从业者在社交平台爆料称,是滴滴系统半夜被攻击所致。

“服务器没有物理隔离,物理攻击后台服务全挂,dc都上不去。”从表现上看,打车、共享单车全挂,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施。从全线产品线出问题来看,可能是数据库批量挂掉,恢复数据完成时间不可控。当然,也有可能是系统升级导致基础架构崩溃,比如云平台崩溃,问题难定位。

f272eb1767b5b09dcf3c0719b19fe8ba.jpeg

对此,业内专家表示,这种全网性业务全阻可能是由多个因素共同作用所导致的结果。否则,在当前的IT系统中,尤其是已经云化部署的IT系统,由于其去中心化的特性,全业务阻断的风险应该是相对较小的。

aa208dc5b854e896e1b680e732fc809f.jpeg

也有业内人士表示,出问题的应该是滴滴自己的IDC,这种事故也会加速滴滴全部上云的步伐。

686fc1703b0680ff8a1191a95cbc27da.jpeg

业内人士经验表示,80%以上的故障都是变更导致的。技术人员一方面期待得到故障原因的披露,一方面也明白,其他人能从故障中汲取的教训往往有限。一起大型故障往往是多个层面失守叠加的影响,导致整体防线被击穿。

ef89194dd97fa43dc719fe4af10d37f5.jpeg

滴滴本次事故事件超过12个小时,损失金额超4亿元,属于业界内公认的P0级故障,截止到本文发表,滴滴大部分服务已经恢复

06e47e365da9736eb862cc0914264fab.png

956c63b3b06fc8b2541c7db04e074601.jpeg

据业内专家分析,一般大规模的系统崩溃,无外乎以下几个原因

一是系统升级失败,在测试没有覆盖到的情况下上线;

二是服务器故障,遇到天灾人祸等;

三是第三方服务故障,用了三方组件,组件挂了导致服务失效;

四是遇到黑客攻击,脱库等。

目前看起来,第一二种可能性较大;希望滴滴好好总结,把底层服务做好吧;

最后推荐一下AI时代来临的入门课,程序员大佬小灰出品的AI学习手册

204cb517fb1ba6520219f607628ac817.jpeg

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值