前言
如果老板问你最近日活量(或者其他指标)出现下降/异常,是什么原因?
数据异常主要从两个大方向进行排查:①数据是否有问题?②业务是否有问题?
针对这两个方向,可以将数据异常排查分为以下几个步骤:
一、数据是否有问题,即数据是否是真的异常?
(1)亲自查看数据准确性,不要人云亦云
(2)时间轴拉长,看是近期异常(3个月)还是历史异常
(3)看和该指标关联的其他指标或其他核心指标是否也异常
(4)找到一个关键任务(产品/数据),提前沟通一下
二、如果数据是真的异常,怎么排查?
在分析异常原因时,最好先将用户进行拆分,常见的几个拆分维度
(1)按注册时间:新用户/老用户
(2)按登陆平台:iOS/安卓
(3)按新旧版本:新版本/旧版本
(4)按时间:淡季旺季、日间和夜间、周期性产品
将用户进行细分后,再分别对每一个维度进行原因排查,最大概率法归类(找出所有的可能,讲它们出现的概率进行排序)
(1)假期效应:开学季、暑期、四大节、当地节日
(2)热点事件:常规热点和世界杯、突发热点某爆款IP
(3)活动影响:双11、618、公司层面活动
(4)政策影响:互联网金融监管、快递行业实名
(5)底层系统故障:数据传输、存储、清洗有无问题
(6)统计口径:业务逻辑更改、指标计算方式更改
三、针对步骤二发现的异常原因进行验证
(1)凡事用数据说话,即便是有时候觉得异常原因很符合我们的直觉,但是如果有条件的话,还是希望能够进行一下ABtest、假设检验,用数据验证你的假设。
四、案例分析
以下是一个案例分析:
总结
先检查数据是否真的异常,如果是,那么将用户进行细分,分别找出每一部分用户最可能的异常原因,最后使用数据对这些原因进行验证。**