数据分析避坑指南-分析思路篇

本文讲述了数据分析师在面对异常数据和业务问题时如何避免常见误区,包括理解指标口径、警惕辛普森悖论、防止相关因果谬论,并提供了业务流程驱动、部门职能导向和策略目标导向的分析思路。通过实例解析,帮助分析师建立清晰的分析框架,提高问题解决能力。
摘要由CSDN通过智能技术生成

来源:网易有数    作者:九条

作为分析师,需要对数据和结论负责,所以一定要“大胆猜测、小心求证”。如何小心求证呢?笔者看到、也经历过一些“踩坑血泪史”,下面就从定位问题、分析思路的角度,跟大家分享下。

1

定位问题

场景1:

首先还是老套路,给大家一个选择题:

一个业务同学急急忙忙的找到你,说活动页面的跳出率数据异常,大家觉得第一步应该做什么?

A.反问活动页是否有调整 

B.查下数据任务是否异常 

C.明确“跳出率”口径

--------------10秒钟思考--------------

这是比较常见的场景,为了“确定问题”,我们首先需要明确指标的口径,尤其是有分子、分母的指标,更要清晰分子、分母的定义,否则容易导致“定义谬论”,所以答案是C。

这是笔者遇到过的真实案例,当时业务看到的“跳出率”,是“APP跳出率”,即【跳出APP的人数/页面访问人数】,但对于活动页面的场景,更常规关注的指标是“页面跳出率”,即【页面无点击行为人数/页面访问人数】。所以如果一开始指标的定义就没搞清楚,就开始启动探查和分析,很容易导致南辕北辙。

场景2:

刚才这道题是不是很简单?现在给大家上点难度。

又是这个业务同学,跟你哭诉:累死累活做了个活动,但是“访问支付率”(PS:支付用户数/访问用户数)竟然还下降了(如下表,非真实数据)。

94439f067f2c4bd0abfd3b74026c2bae.png

这时候你会?

A.一起抱头痛哭 

B.鼓励他继续努力

C.可能是辛普森悖论,还需探查

选A的朋友,请控制情绪;选B的朋友,请冷静下来先思考下。

这个场景,其实是比较典型的辛普森悖论,是否可以根据整体指标的下降、就断定活动效果不好呢?

还得按照目标人群去拆分观察,比如按活跃度拆分(非真实数据):

ef8422b69d5105774fc16ba9c08eef53.png

神奇了是不是,每类用户群的指标都是上涨的了!

这就是辛普森悖论,即分组都较优的情况下、整体却反而会变差,主要原因是分组的占比相差大,占比低、表现弱势的用户群,随着占比提升、会影响整体的表现。

针对这个问题本身,其实本质情况是沉默用户、新用户占比升高,这个就可以结合活动的策略及目标,判断是否是问题,再进行分析。

场景3:

还是这个业务同学(他的问题有点多hhh),某天突然找到你,神神秘秘地说自己有个大发现:

花卖得越多,店铺的刮胡刀、按摩椅就卖得越多,没想到卖花还能有这作用!自己准备再多卖些花。

这是“相关因果谬论”,误把相关当因果,花和刮胡刀、按摩椅都卖得好,可能是跟父亲节、端午节等节日有关,而不是卖花能导致刮胡刀、按摩椅卖得好。

因此分析师需要深入了解业务,才能探查现象背后的本质,避免发生相关因果谬论类的尴尬。

2

分析思路

以上是在判断问题时,几种较常见的坑,而对于分析师来说,还有一种更常见的坑,叫“乱七八糟胡乱分析”坑。

之前的文章有介绍过矩阵分析、杜邦分析、交叉分析等方法,而一些分析同学在具体实践时,很容易狂堆各种维度,什么用户画像、商品画像、场景画像,噼里啪啦一堆取数,各种盲目地交叉分析,最后整了个几百M的Excel,但是啥有价值的结论也没探查出,然后开始怀疑人生......

那有哪些方法可以帮助我们梳理思路,或者说明确分析框架呢?常用的思路有以下几种:

1、业务流程驱动:业务流程既是了解业务的基础,也是常用的分析框架,需要清楚“结果”是由哪些“环节”导致的,且明晰各“环节”可能与结果相关的因素,就容易探查出相对本质的原因。

例:某商品发生缺货,可以梳理出商品供应的关键节点,评估各个节点上可能的原因,再通过数据去论证。如缺货可能是在做销量预测时即偏低,也可能是下单环节为了控制库转、保守备货,只有梳理清楚相关节点及影响因素,才更容易得到有价值的结论。

c4bf7dd4649939d9e62bdde3a395de17.png

2、部门职能导向:数据分析是为了明确问题,且定位到具体执行的人或部门,这样才容易推动落地。因此在梳理分析框架时,可按照部门职能,分模块进行分析。

例:活动分析场景,活动分析的维度众多,复盘活动效果最常用的思路之一,就是按活动的负责部门去分类,定位每个部门的好坏、给出相关策略建议,如下图(非真实数据):

02f7a885c83972d15535e4a8272c3a20.png

3、策略目标导向:在做业务分析、尤其是复盘时,分析师经常会遇到无法“判断好坏”,或无法找到分析切入点的情况。很多情况还是归因于“不够了解业务”,既然做分析复盘,还是需要明确业务当时的目标是什么、有哪些策略、策略的方向和目标是什么,以此为基准、确定分析方向,会更加符合客观情况,也更容易与业务达成一致。

例:如下图针对促销活动的分析(非真实数据),可与业务梳理和明确活动目标、策略情况,形成自己的分析复盘的框架:

838085f2a7fb6e42aa6801992ab5b4e5.png

3

小结

这次跟大家介绍了在【定位问题】和【确定分析思路】时,常见的坑及解决方法,也希望大家遇到类似的场景时,会多些谨慎、多些思路。

数据分析路漫漫,大家在做分析时有遇到什么坑吗?欢迎分享。

成都CDA数据分析师

定期分享

数据分析的干货和岗位内推机会

f65dd2e4411b95fd4264142f1f9ae96f.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值