1.目前数据本身有问题
2.业务本身有问题
数据异常排查的前期准备:
-
业务理解
-
指标口径
-
当前数据产出过程
异常排查步骤:
- 判断是否异常
- 最大概率法则归类
- 闭环
第一步判断是否异常,有4个关键点:
-
亲自去看数据准确性,不要人云亦云
-
时间轴拉长,看是近期异常(3个月)还是历史异常
-
看和该指标关联的其他指标或其他核心指标是否也异常
-
找到一个关键人物(产品/数据),提前沟通
第二部就是最大概率法则归类
-
假期效应:开学季、暑假、四大节、当地节日
-
热点事件:常规热点(世界杯)、突发热点(爆款IP)
-
活动影响:双11、618,公司层面活动
-
政策影响:互联网金融监管,快递实名
-
底层系统故障:数据传输、存储、清洗有问题
-
统计口径:业务逻辑更改、指标计算方式更改
第三部就是闭环,当我们排查出问题原因后,一定要形成闭环,关于闭环有三点:
- 持续跟踪后期数据是否再次异常:比如当我们排查出原因后,产品作相应的改进,而问题仍在就说明前期排查问题出错
- 记录、沉淀、文档化,因为后续我们可能还会遇到相同问题,所以记录文档利人利己
- 邮件化,只有确认没有问题再发邮件给相关方,描述影响范围和主要结论即可