在最近发布项目的后续优化版本中已经记了两个A级故障,哭晕在厕所了!没办法测试的职责就是把控项目质量的,所以最后的锅还得背
第一个故障:
故障描述:在发布新版本中,出现部分用户网络连接失败
原因:弱网情况下,socket连接异常,堵塞用户下续操作(这个故障原因其实一直查不到就随便写了一个~)
后续处理:新包发布,先打一个日志包给到销售方,由销售方给到部分核心用户体验,收集数据体验稳定后,在开放全面升级
这个坑踩得无比冤枉但又挺值得的,改正了发布流程,新包和体验包迭代给出避免出现一些偶现现象将问题扩大化。
第二个故障:
故障描述:生产中流程无法进行
原因:预发环境保存后台新增配置后,超过数据库长度,数据库自动截取,导致后*续需要拿配置数据时拿的是截取数据无法解析,且在预发更新了生产Redis
后续处理:在测试环境时配置与生产配置保持一致,对边界值注意;
同时检查其他项目的配置的字段长度做扩充准备;
再设计阶段预估字段长度并做校验
导致这个问题的发生主要是
1、在测试时没有将字段长度考虑进来(主要考虑的是功能去了,因为根本没有想到这个啊),数据库设计的长度是500但是刚好这次是501都是命
2、预发环境影响到了生产key(经过这次查了一下公司其他项目都有这个问题,这个坑我踩得其所~!)
工作嘛总是会有踩不完的坑,但是能从每次坑中发现以及改进问题并且做好预防措施这一切其实还很值得的。
世上本没有路,走的人多了便成了路 ——鲁迅