- 问题发生、解决时间以及问题系统
序号 | 问题实际发生时间 | 问题实际解决时间 | 问题系统 | 问题影响具体描述(可把相关涉及系统补充进来) |
---|---|---|---|---|
1 |
- 问题描述【描述问题场景、具体问题、错误截图、告警和日志信息】
- 解决方案
- 临时解决方案(可选填)
- 根本解决方案
- 问题分析和处理过程【详细描述问题分析和处理的过程与步骤,不得跳跃】
- 预防措施或优化步骤(根据实际情况选填)
序号 | 预防措施或优化步骤思考点 |
---|---|
1 | 如何预防同类问题发生?如何提升容错能力 |
2 | 定位问题花了多长时间?如何提升? |
3 | 怎么进行应急的,如何提升? |
4 | 如是变更问题,是否第一时间进行了回滚?如何提升 |
5 | 为什么未能通过测试发现问题? |
6 | 故障是否有第一时间被监控到或告警?如何提升? |
自动化监控能力,目前还是我们的薄弱点,后续时机合适补上 |