项目上线后常见痛点规避

Ⅰ、分析事故

1、事故等级定义

检查bug是否业务核心环节的功能问题,若涉及则认为bug比较严重。
检查bug是否涉及到用户的个人信息泄露、资金财产损失等比较敏感的功能,若涉及则认为bug比较严重。

2、故障处理

判断若bug影响范围较小时,可通过修复bug的方式解决。
在该bug可控的情况下,该修复修复,该测试测试,在测试修复原bug影响的情况下没有产生新的缺陷问题,测试为修复完成。
若测试过程中产生了新的缺陷问题,则视为不可控情况,这个就考虑项目延期或各负责人加班加点处理。
可控情况下bug解决方法如下:

①了解bug出现的场景,判断时人为还是业务引起并记录。
②有条件的同学可以配合上下游系统同事复现bug,根据复现时间点查询各项报错日志(不可复现则根据报错时间段查询)如系统日志、数据库日志、debug日志、操作日志等。
③确定bug产生的原因,与客户方汇报并商议bug修复上线时间。
④交由相关开发负责人尽快修复并由测试方进行回归测试,后进行一次review(要求测试参与进来)
⑤测试通过后按项目规划时间或客户商议时间进行上线升级

判断若bug影响范围较大且不可控制,解决起来比较麻烦。

①对bug无法复现无法明确的时候,立即回滚版本规避该风险。
②对部分用户功能进行功能降级或关闭,并进一步观察
③若判断为性能问题,则考虑重启系统或扩容系统,并进一步观察
④得到缓冲时间后,按上一个bug解决方法处理,做好备份,该bug影响功能延后上线,其他功能正常上线。

3、影响服务质量的因素

线上问题复盘

①检查其他的业务是否有同类型的问题,有问题的话提前解决,避免遗漏上线
②分析bug的根本原因,考虑如何避免此类问题再次发生
③分析bug是在哪个阶段引入,设计阶段、开发阶段、测试阶段
④分析bug引入的原因是什么,是流程问题、技术问题、管理问题
⑤处理问题的流程是否合理,是否有问题预警、是否有紧急上线规范。

4、故障发现-监控体系

应用监控:设置应用合规logback日志或其他日志控制
服务器监控:是否搭建WGCLOUD、1panel等其他运维监控平台;或购买各服务商运维管理方案

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值