前言:整理了一下项目线上问题应急处理规范,仅供参考!
1.1线上报障流程
1.2.目的
为了明确线上事件的报告、应急响应和处理机制,确保能以快速、高效、准确的应急处理能力来保证各类系统的正常运转,当发生突发事件时能在最短的时间内恢复系统的正常运转,将影响降到最低,规范知蓝侧应急处理方案,特拟定此流程。
1.3.线上问题定义
1.4.问题处理
1)接到线上事件报告后,测试首先判断线上事故的性质,同时进行复现,如果事件级别达到P1级及以上应第一时间按照线上报障流程规范要求通知相关负责人。由测试组织问题处理,随时将处理情况上报给受影响的业务方及知蓝侧NOC团队。
2)线上故障为P0级,需立即通知运维、研发、产品负责人,并告知项目经理及部门负责人。由各小组负责人协调事故处理,10分钟内响应事故,2小时内给予解决保证系统恢复正常,并及时告知业务侧、项目经理及部门负责人。
3)线上故障为P1级,需立即通通知运维、研发、产品负责人,并告知项目经理及部门负责人。由各小组负责人协调事故处理,10分钟内响应事故,1小时内给予解决保证系统恢复正常,并及时告知业务侧、项目经理及部门负责人。
4)线上故障为P2级,测试需将问题录入TAPD,通知产品及研发,并告知相关产品及技术负责人,由产品评定问题风险,研发负责人协调处理线上事故,测试回归验证,引导用户通过其它方式操作,减少对业务侧影响,尽快处理完毕。
5)如果判定为非事故,需要协助解决或者引导用户找到解决方法。如果为需求bug或优化建议,则反馈给产品侧,由产品侧判定问题及给出处理意见。
1.5.验证问题
线上故障受理后都需要测试人员实时跟进,协助研发人员定位问题。P0、P1级故障修复后第一时间验证并告知验证结果。P2级故障开发人员修复后及时更新缺陷状态并告知测试人员验证,由产品经理评估是否需要发布。
1)需要发布。测试人员向项目经理发出上线申请,按照上线发布流程规范进行程序发布。
2)不需要发布。测试人员直接验证问题是否已解决,如验证通过,需要在TAPD中关闭问题单,若验证不通过,则将问题单重新打开并提醒研发处理人进行重新修复。
1.6.通知业务方
1)P0级及P1级故障,故障修复前由测试人员跟进问题处理进展,定时告知业务方(问题反馈人)进展,直至故障排除,系统恢复正常。
2)P2级故障,由测试人员跟进问题状态,问题单关闭后及时告知问题业务方(问题反馈人),发布上线后通知问题反馈人(问题反馈人)验证。
1.7.应急处理小组成员联系方式
姓名 | 电话 |
---|---|
张三 | 131xxxxxxxx |
李四 | 132xxxxxxxx |
王五 | 133xxxxxxxx |
赵六 | 134xxxxxxxx |
刘七 | 135xxxxxxxx |
沈八 | 136xxxxxxxx |
杨九 | 137xxxxxxxx |