4月27日,首届“全球信息系统稳定性峰会”在北京召开。会上,中国信息通信研究院(以下简称“中国信通院”) 公布了首批信息系统稳定性保障能力评估结果、分布式系统稳定性实验室成员单位、信息系统平稳运行优秀案例。蚂蚁集团当选为实验室成员单位,其支付平台凭借在系统稳定和安全等方面的技术与实践,获得“系统平稳运行优秀案例”颁证。
作为实验室成员单位,蚂蚁集团积极参与编写了系统稳定性相关的标准及研究报告,此次峰会上,蚂蚁集团数字科技事业群技术副总经理石世群也做了《支付宝系统双十一稳定性保障经验分享》的主题演讲,分享蚂蚁集团金融级分布式架构SOFAStack在系统稳定性保障领域的探索和实践经验。
以下为演讲整理全文:
大家好,我是蚂蚁集团数字科技的石世群。今天我将在线介绍支付宝双11稳定性保障的相关内容。
系统的稳定性保障,是一个复杂的系统工程。从2004年到2021年,支付宝经历了一系列的技术架构升级和迭代,从单元化架构走向弹性上云,进而演化到云原生、绿色计算,这个过程既要考虑容量稳定性,也要考虑成本和效率。
我们做了简单的总结,大概经历三个阶段:
- 第一阶段,主要解决容量的问题。通过LDC、弹性能力和OceanBase,解决了容量理论上无限伸缩的能力。同时,通过全链路压测技术很好的对全链路容量进行验证;
- 第二阶段,当支付的容量能力达标后,进一步考虑的就是如何通过技术创新去提升整体架构的稳定和效率。典型的场景有2个,一个是云原生,云原生架构的核心理念是将基础设施和业务进行剥离,从而释放基础设施的红利,大幅提升创新速度和效率,比较典型的案例就是ServiceMesh在蚂蚁的落地。另一个就是我们对于智能监控运维体系,通过数据智能的方式,提升系统应急响应恢复的反应速度。
- 第三阶段,绿色减排。连续几年,我们在保持峰值稳步增长的情况下,提出了大促0成本新增。2021年双11,我们的主要方向就聚焦在绿色减排上,通过离在线混部、分时调度、智能AI容量等创新技术,实现节约64万度电和394吨碳减排。
接下来,我给大家介绍一下支付宝双11大促的关键技