都说大公司花样多,最近支付宝就曝光了内部一支神秘的技术团队,整天什么事儿都不干,就负责给其它团队“找茬”。
实际上,这个天天“没事找事儿”的组织被称为支付宝的“技术蓝军”,其主要的职责就是通过寻找系统脆弱点并发起攻击,让内部各业务技术团队组成的“技术红军”在防守过程中,查漏补缺,提升系统的可靠性与风险危机的应对能力。
自2017年秋天蓝军正式成立以来,双方经常摆开阵势“大打出手”。面对“蓝军”花样百出从不间断的各种攻击,“红军”们也在不断升级自己的“武器库”,从自适应容灾、防抖、精细化高可用等方面建立起了完备的故障防御系统,将攻势化解于无形并在此过程中积累了丰富的风险预控经验。
“拜关公”也成为了每次对抗前的重要“习俗”
一年过去,这样激烈的攻防演练已日渐常态化,据说“红蓝对抗”已达到了每周超过200个故障场景的持续运作节奏。而从2016年开始,支付宝还连续三年分别在5月和12月举行两次大型演练,并将这两场全栈级别的大型攻防对抗作为内部技术团队的期中和期末考。
具体考察的内容,就是通过模拟各种极端的天灾人祸,比如台风、火灾、断网、误操作等等,锻炼技术人员的快速应对能力。支付宝也由此磨练出了一整套风险防控体系,让整个系统越来越靠得住。在今年的杭州云栖ATEC大会上,蚂蚁金服副CTO胡喜就曾在现场演练的异常断网情况下,“三地五中心”自动切换,保证支付服务不中断。
据悉,这些技术风险相关的能力目前已正式对外开放,包括容灾应急平台、全链路压测、资金安全监控、变更管控、巡检平台以及黑屏运维管控等产品,都可以在蚂蚁金融科技官网(tech.antfin.com)了解。