一、事件回顾
事情相信大家都已经听说了,支付宝2025年首个P0级事故:2025年1月16日,网上多位支付宝用户发布订单支付页面截图,声称自己在下午14:40-14:45时间段内,在支付宝支付时享受到了“政府补贴”优惠20%,也就是打8折,如下图:
并且更为可怕的是,此次优惠不只是针对某一类操作,而是涵盖了个人转账、购票、还信用卡、缴纳房租等,作为曾经负责过大公司营销条线测试的杨叔来说,猜测应该就是创建了一个通用全品类的促销优惠活动:
事件发生之后,网上有网友分享说收到了资金追回短信,对此支付宝官方微博也是在深夜发文澄清:支付宝官方没有发送任何资金追回短信,告诉大家如果收到了类似短信,千万不要点,以免上当受骗
而对于本次事件的原因,支付宝官方解释为:支付宝某个常规营销活动后台配置错了营销模板,把优惠额度和优惠金额都写错了
二、事件分析
那么根据官方的解释,这次背锅的应该就是营销运营团队了,估计整个营销运营团队今年这个年不太好过了,特别是年终奖这会儿还没发到手…
按照杨叔的经验,发生了这样P0级别的事故,下到配错模板的这位运营打工人,上到组内的leader,再往上的营销运营总监,都或多或少会有连带责任。
正常来讲,这么大的活动,活动配置生效肯定是需要逐级审批,至于为什么审批没有发现问题?盲猜是审批的领导当时可能并没有注意到这个细节,要知道支付宝这样的大公司,每天经手的这种类似的运营活动审批恐怕不低于上百次,百密一疏完全有可能。
不过作为一名测试人,按官方的这个解释,好消息是本次事故应该和研发、测试团队无关了,估计当时整个营销条线的研发、测试团队都是菊花一紧~
而支付宝本次的公关应对,个人觉得是做得非常不错的,没有遮遮掩掩,而是主动承担并承认错误,也没有将责任推给消费者,承诺支付宝不会向用户追款,请大家放心:
支付宝的核心功能之一就是替大家管理资金,出了问题勇于承担责任,才能让消费者放心继续将资金交付给支付宝管理,不然今天肯定会被各种骂上热搜。
虽然本次可能损失可能达到千万甚至更高的级别,但是目前的这种处理方式,何尝又不是很好的广告宣传呢。
同时作为技术博主,虽然支付宝出了这样的事故,但是杨叔也为他们的事故处理速度点赞。整个事故只持续了5分钟时间,侧面说明了支付宝肯定有非常健全的监控告警机制!
线上异常数据能快速被监控到,并及时发出告警,并且反馈的信息能帮助技术人员快速定位到问题,才最终让整个在5分钟内快速完成闭环处理。
要知道,这种事故,5分钟内处理闭环和10分钟内处理闭环,一定不是简单的翻倍,而是呈现几何倍数递增的效果。
但同时,恐怕也给运营部门的老板们提出了一个难题:如何规避人工审批的疏漏?
常规来说,审批都是由下往上的,但是越往上往往越没办法了解清楚细节,这是非常矛盾的地方。恐怕运营部门的P0事故报告里面也会提到这一点,未来应该要更多的借助AI的能力,通过AI自动识别更多的异常风险,进一步规避人工疏漏的可能。
喜欢的同学麻烦点个赞+收藏+关注,一键三连!欢迎关注下方我的公众号:程序员杨叔,各类文章都会第一时间在上面发布,持续分享各类测试开发知识干货,你的支持就是作者更新最大的动力。