一文搞懂数据异常问题该如何分析

 上一篇文章给大家介绍了如何巧解费米问题,这篇文章将给大家带来另外一类高频考题——业务分析题,主要以“销售收入下降了该如何分析”这个问题为主线进行分析。

一、数据异常波动的表现形式

数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当我们面对市场、产品、运营等各种业务场景,经常会发现很多异常数据的问题,比如:

  1. 某APP日活DAU相比昨日突然下降了10%,该如何分析?

  2. 某公司销售收入环比上月下降了15%,该如何分析?

  3. 某产品客单价环比上月下降了20%,该如何分析?

上述各种业务场景,其实都是发现了数据有异常波动的情况,那接下来问题来了,我们该如何着手进行分析呢?

大部分人解决问题的思路,都是直奔主题找原因,上来就去找出现异常的原因、异常点在哪里。其实这种分析思路有一个最大的弊端就是不够体系化,往往能够找到一些原因,但是很可能是片面的,甚至可能还会踩雷。接下来就给大家分享一种比较实用的方法,我个人称之为“点 - 线 - 面”分析法。

二、数据异常分析的方法论

点:首先排查数据准确性,确定是否属于数据错误。容易出现数据错误的环节有数据采集环节(埋点)、数据提取环节、产品环节(BUG)、业务环节(数据口径)等。如果没有问题进入下一步分析;

线:拉长时间周期,也就是进行纵向分析,看是否属于周期性波动,有些行业受季节或淡旺季影响较大,比如家电、饮料、在线教育等都受淡旺季影响较大。如果没有问题进入下一步分析;

面:首先,综合运用公式拆解法、多维度拆解法等对大问题进行拆解,拆解为一个个可着手分析的小问题;然后,通过计算影响系数初步定位到主要影响原因;最后,大胆假设,小心验证,通过假设检验法逐步排查到产生问题的根本原因。

比如,我们以销售收入下降为例,通过“点 - 线 - 面”分析中的“点 - 线”分析确认属于数据异常后,接下来就可以在“”的分析环节中采用“三部曲分析”法,主要流程如下:

1. 运用公式拆解法、多维度拆解法等对大问题进行拆解

2. 计算影响系数,定位主要原因

影响系数 = ( 细分项本月数 - 细分项上月数 ) / ( 本月总量 - 上月总量 )

影响系数越大,说明该维度数据就是造成总体波动的主要影响因素。

3. 通过假设检验法逐步排查根本原因

假设在计算影响系数后,初步确定主要是新用户减少引起的收入下降,接下来就需要对新用户数下降的原因进行假设,常见的假设维度有内、外部维度,其中内部维度主要有渠道侧、产品侧、运营侧、技术侧等等,然后通过数据逐一对上述假设进行验证。

以上是几种常见的拆分维度,通过初步拆分,定位原因大致范围。

三、数据异常分析的案例实战

某连锁零售集团最近两年每月销售收入保持稳中有升的趋势,但是在2021年6月销售收入突然下降了17%(下图),这时销售负责人非常着急,让你尽快排查一下销售下跌的原因。面对收入下降这种棘手的问题,如果对于没有经验的同学,确实还是比较头疼的,就像那烫手的山芋,无从下手。

接下来,我们就按照按照上面的套路来演练一下。

点:首先排查数据准确性,确定不属于数据错误;

线:拉长时间周期,不属于季节波动;

面:1. 首先把总收入拆分成新、老用户收入,如下图:

通过观察数据,发现新、老用户收入均有不同程度下滑,于是启动第二步,分别计算其影响系数。

2. 计算新、老用户收入影响系数

新用户收入影响系数 = (33 - 47) / (100 - 120) = 0.7

老用户收入影响系数 = (67 - 73) / (100 - 120) = 0.3

新用户收入影响系数0.7,说明总收入下降主要影响因素是新用户收入下降,明确问题的范围后接着进行细分,新用户收入的构成是什么?

新用户收入 = 新用户数量 * 转化率 * 客单价

通过调取数据分析发现,新用户转化率和客单价都保持稳定,那么问题就出在了新用户数量这个指标上,那新用户又是由什么构成呢?

新用户 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n 

于是我们把新用户按照其渠道来源进行拆分:

通过对新用户渠道来源进行拆分,我们发现渠道1在2021年6月新用户数量下降非常严重,于是我们就定位到收入下滑的根本原因在于渠道1新用户数量下滑严重。接下来我们就可以启动第三步,对渠道1新用户数量下滑原因进行假设检验。

3. 对渠道新用户数下滑原因进行假设检验

渠道流量下降可能的原因可以从两个大的维度进行考虑:对于外部维度,可以考虑外部环境变动、竞品变化等;对于内部维度,可能的原因有渠道线索问题、投放策略变化等。这个时候一方面要调取数据进行分析验证,另一方面需要联系渠道1的负责人一起定位具体原因,找到具体原因后,再对症下药。

本案例纯属虚构,如有雷同,纯属巧合。当然,实际的业务要比这复杂的多,需要考虑的因素也很多,花费的时间也会更长。但是,解决问题的方法论和流程是可复用的。相信大家以后再面对类似问题的时候,会有一个清晰的分析思路和明确的入手点。

最后,我们如果对上面的“点 - 线 - 面”分析法进行总结归纳的话,可以提炼为下面这张图:

关注我,获取更多数据分析干货!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值