本人新接手某业务线,有数万历史线上问题,治理过程中发现这些问题的平均复现率只有40%,并且持续无法提升。最终治理取得了不错的成果,在此分享如果遇到问题复现率较低应该怎么突破。
一、治理思路
●问题分类:
通过问题描述中提取关键词:分应用、分功能模块、分类型、分端 等措施将大池子分割成有规律的、能具体到处理人的小池子。(这个阶段可能会有大量不准确,没关系,后续调整即可)
●问题标签化:
在确认-修复的整个过程中,积累对应标签(包括但不局限于:复现\不可复现、主链路\非主链路、问题类型)
●问题复现操作经验积累:
通过问题描述复现。如果第一次无法复现,集中处理,寻找复现规律。
●标签校准和信息补齐:
能复现(确认)的问题,直接校准分类和标签(确认高频问题和多问题模块);不能复现的问题,做可测性建设。
二、抽象总结的参考方法
2.1 正常场景问题复现
2.1.1 场景链路法复现:
用户提供的信息充足(截图、录屏或详细文字等有效信息以及机型、日志等辅助信息)表明了错误比较显著,同时操作链路比较完整,则可以通过场景链路复现。