Python大本营每日一课
大家好,本期7日专栏内容,营长将为大家分享新的内容知识,“数据分析”,营长邀请的是宿永杰,某知名互联网公司数据挖掘工程师,小伙伴们别忘记打卡哦。
数据分析必知必会的两个原则
DAY06
上期我们分享了每日一课 | 数据分析的本质是什么?不清楚的小伙伴可以点击查看详情哦!
每一个在职场工作的人,我相信,面对遇到的问题都会有极大的热情去解决,可为什么别人解决问题很快就可以把握重点,做到面面俱到,为什么自己却丢三落四,不分主次?同样都在努力,结果却不尽相同呢, 有人还在原地踏步,有人却升职加薪?
就拿我来说,在职场工作了多年以后,直到现在才明白一个道理,那就是解决问题的思维方式造就了不同的结局,在工作中,除了努力,有一些方法论是必须要掌握的,我们不能用战术上的勤奋掩盖战略上的懒惰。
所以,下面我要分享的两个原则,它俩不仅局限在数据分析,在解决其他现实、管理、创业问题时同样适用。
先说说这两个原则是什么呢?帕累托原则和 MECE 原则。帕累托原则从宏观的角度考虑,把握问题的重点与核心部分,而 MECE 原则偏向从微观的角度,层层递进,做到综合全面。
帕累托原则
什么是帕累托原则呢?其实就是我们耳熟能详的二八原则,也叫也叫巴莱特定律、朱伦法则(Juran’s Principle)、关键少数法则(Vital Few Rule)、不重要多数法则(Trivial Many Rule)最省力的法则、不平衡原则等 ,被广泛应用在商业活动分析中。
当我们面对一长系列的数据或者问题是,如果一个个穷举解决,要花费很长的时间和精力,让人心存畏惧觉得不能完成,如果运用帕累托原则,我们就可以快速定位主次因素,然后决定解决问题的优先级,先解决主要因素,在解决次要问题。
通过一些学者的研究,对于二八原则,基本有这样一些被认可的结论:
80% 的销售额来自 20% 的渠道;
80% 的订单来自 20% 的顾客;
80% 的营业利润来自 20% 的成交。
举例来说, 根据某电商广告投放来说 ,在业务发展某一阶段,老板和领导层定的 KPI 主要是 GMV, 各渠道贡献出来的收入情况基本符合帕累托原则(数据脱密处理了),如下图所示:
如果某天的产品 GMV 波动很大,上升了当然的好事,可如果下降超出预期,该怎么办呢?
首先,我们应该抓住主要的关键因素,看头部渠道如淘宝、支付宝、京东具体的变化,因为他们贡献的 GMV 的变化更能影响整体 GMV 的变化。
做数据分析时,我们最容易犯的错误就是被平均数迷惑,聪明的人都会放弃平均,古有楚汉之争,今有划江而治, 蛋糕是无法被平分的,唯有做大做强。
通过二八原则窥探数据,你将会在业务中发现很多你意识不到的情况,这些情况有好有坏,但这也许会成为解决问题的突破口和机会,应该被重视和利用起来!
MECE 原则
什么是 MECE(Mutually Exclusive Collectively Exhaustive)原则?其含义指拆解问题时要做到相互独立,完全穷尽。
在什么情况下,我们会考虑使用 MECE 原则呢?往往是遇到比较复杂的问题,或者是面对金字塔顶端的问题或者指标时,为了避免以偏概全和重叠导致无法梳理清楚真正的问题原因时,我们会选择使用 MECE 原则,进行问题拆解。
我们还是以上面的例子,假如某天的产品 GMV 波动很大,下降超出预期,我们怎么用 MECE 来分析呢?
第一步,确定当下的问题,GMV 下降了,且超出预期,不是数据问题,接下来确定我们的目的是要找到问题原因,并且给出优化建议;
第二步,找到符合 MECE 的切入点,进行分类。这里我们使用公式法进行问题拆解。
GMV = 订单数 * 客单价
=(渠道 A 订单数 * 转化率 + 渠道 B 订单数 * 转化率 +...+ 渠道 N 订单数 * 转化率)* 客单价
=(渠道 A 流量 * 转化率 + 渠道 B 流量 * 转化率 +...+ 渠道 N 流量 * 转化率)* 客单价
= ......
比如拆解到渠道上面,如果有很多渠道怎么办,这个时候,通过二八原则来定位下,根据渠道贡献 GMV 占比,找到最主要影响 GMV 下降的渠道,假如通过分析发现果然主要由渠道 A 引起的,那我们可以继续从渠道 A 进行分析了。
假设渠道 A 用户下单转化流程是:浏览访问—加购物车—下单—支付,采用漏斗分析法,从上面的转化漏斗,我们发现用户支付的转化率比较低,从下单到支付成功,只有 28.2% 的转化率,这有点不正常,是什么原因造成了支付转化率较低呢?
到目前为止,我们定位到了更具体的原因,大盘 GMV 下降的原因是,渠道 A 引起的,主要是渠道 A 支付转化率降低引起的,那是什么原因引起渠道 A 转化率降低呢?
这个时候继续分析,采用二分法,从内部和外部环境来看。
如果从外部分析的话,使用 PEST 模型,从政治、经济、社会和技术方面考虑。
如果从内部分析的话,作为分析师,我们有必要去体验下产品下单到支付路径,有没有发生什么原因和变化,其次,基于业务理解的理解,不看不知道,一看吓一跳,原因找到了,由于做活动,商品介绍的海报中指定满减的活动,让用户看起来买的很划算,但是在真实支付的时候,并没有满减,而是提示优惠额度已经用完,提示用户是否继续支付,所以很多用户就放弃了。
所以,问题的原因在于,海报中介绍的满减活动,由于名额问题,并没有执行好,再深刻可解释为存在欺骗用户和引诱下单的行为。
所以,针对该问题,我们提出如下建议:
尽快恢复满减额度,确保知行合一;
或者撤销活动海报的满减优惠;
如果满足条件,给未支付的用户发短信通知满减消息的真实性,引导其回来支付等。
以上,通过很简单的实例来介绍数据分析的两大原则,你学到了吗?
总结
本篇,通过案例介绍了数据分析必知必会的两个原则,帕累托原则和 MECE 原则。这两个原则非常实用,且不仅仅局限在数据分析时,做任何决策计划的时候,都应该拿出来尝试应用。
明日分享预告:三种思考模型
本期专栏内容均来自GitChat《数据分析面试剖析24讲》专栏内容,作者:宿永杰,某著名互联网公司数据挖掘工程师,如需了解专栏详情,可扫描下方二维码。