下午好,我的网工朋友。
昨天下午网易云崩了,服务器故障,闹的那是沸沸扬扬。
热心网友们的猜测也是五花八门。
21世纪经济报道中,多位有过网易工作经历的技术人员处了解到,此番网易云音乐出现技术故障,或与Curve存储系统有关。该系统由网易开发,团队曾经历过裁员。
网易云音乐官方的回应也是挺有意思的,“没有删库,没有跑路”。
那真相到底是啥?
下班时分,凤凰网科技发布了一则新闻,说是此次宕机事件或与今年二季度的机房搬迁有关。
“网易在贵州建立了机房,旗下业务分阶段搬迁,2024年Q2网易云音乐刚刚完成了贵州机房的迁移。”
据前述知情人士表述,这次搬迁内部曾评估难度极大,稍有不慎就有重大事故发生的可能性。
“前几天刚说这次完成的不错,结果就打脸了。”
图|来自《云音乐贵州机房迁移总体方案回顾》(2024年7月11日)
其认为,近几年互联网公司多出现大型技术事故,多与降本增效相关。
而网易此次搬迁,内部也称实现了大幅的成本下降。“再加上裁员,连故障排查都要很长时间”。
这波事故,最终还是关联上了降本增效(狗头
不过说真的,网易云音乐的机房搬迁,还真是大事儿,搬迁规模不是一般大啊。
2000+应用、100w+QPS的稳定迁移,同时涉及中间件、存储、机房、三方依赖服务等整体的搬迁,这业务复杂度得有多高?
迁移规模大,而不同的场景对数据一致性要求不同、延迟敏感度不同。迁移方案需要考虑各种场景带来的问题,并提供标准化的解决方案。
而且除了服务间也很复杂因素外,历史积弊也多,还有这么多用户,这么大工程,都没办法搞全程预演,必然会影响整体的效率和迁移准确性。
说到这,今天就给大家讲讲全面的机房搬迁方案。
咱不一定能干上这么大规模的机房搬迁,但还是得懂机房搬迁的规划和步骤。
这事儿看起来很复杂,其实一点也不简单,没有系统的规划与步骤,是很难完成的。
今天就通过这份机房搬迁方案ppt,详解这块过程与注意事项。
私信发送暗号“机房搬迁”,还可以获取这份优质PPT资源。
私信发送暗号“机房搬迁”,获取这份优质PPT资源。