part1.数据分析的结构层次
底层数据的收集/产品段收集
数据采集简称埋点,收集用户在网页端、产品端、客户端等终端的数据,也包括第三方外部数据。
即:用户行为--原始数据 (原始数据放在数据库里)
数据可视化/产品的表现如何?
有了数据指标,必须管理好指标。数据分析体系即数据指标体系,指标需要监控和衡量
即:加工数据--可视化数据/信息
数据决策和执行/怎么让产品更好
当从数据中获得洞察,就需要把洞察转换成策略。这也是包含分析得过程。执行即包含策略的制定,也包括优化和改进。这是持续的。
即:可视化数据/信息--数据决策
数据模型/产品开始自动化和系统化的运营
这是将策略制作成数据应用和产品,当你洞察到数据中蕴含的规律,什么样的用户喜欢,什么样的商品会被购买,什么样的活动形式更好,就尝试把这些做成系统。
即:数据决策--数据产品/应用
数据战略/指导未来
当积累了大量的数据,大量的模型,大量的数据应用时,公司级的数据体系已经具备雏形。它不只是数据分析,而是应该将数据变现。
即:数据工具--数据体系/战略
2.怎么学
80%的业务思维,60%的数据能力,40%的工具技巧。
part2:数据分析思维
What:三种核心思维;Why:数据分析的思维技巧;How:如何在业务时间锻炼分析能力
三种核心思维
结构化、公式化、业务化
结构化
将分析思维结构化:将论点归纳和整理;将论点递进和拆解;将论点完善和补充。
麦肯锡金字塔思维
key takeaway:核心论点。比如:销量下降;
main argument:论点。
结构化步骤
1.核心论点:寻找金字塔的塔顶,它可以是假设,是问题,是预测,是原因。
2.结构拆解:自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系。
3.MECE:相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善。
4.验证:不论核心论点还是分论点,都应该是可量化的,用数据说话。它们必然是可验证的。
问题:
1.出现销量问题的原因(外部、内部,内部外部会有交叉部分):
外部因素:市场竞争、市场容量、政策环境、政策风险等人为无法控制的因素。
内部因素:产品自身原因、消费者、地区、时间,都是一些分论点的思考方式。
注:如果假设是地区的因素,但是所有的地区都出现了下跌,则假设是错误的,需要重新假设。
如果是某一个地区下降其他地区正常,就挖掘销量下降是地区因素这个分论点,可以考虑这个地区有没有竞争对手、这个地区的单价有没有变化、这个地区的购买人数有没有变化。如果找到‘购买人数下降’的分论点,就挖掘购买人数下降的原因,可以考虑是不是出了新的商品、是不是有替代品、或者之前有什么外部的原因导致顾客的大量流失。如果发现是顾客的流失,继续发掘流失的原因。。。
金字塔思维帮助更加宏观地考虑,而不是一个点一个点分散的去分析。
结构化的核心是思维导图。(XMind 头脑风暴)总分分。。
结构化是分析的思维,是猜想(eg:外部、市场、调研报告),但它还不够数据,而且难免有发散的缺点。
思维导图
公式化
公式化的核心是把一切量化
特点:1.量化;2.有计算;3.最小不可分割
一切皆可公式
例1:销售额由什么组成?销量和客单价相乘
例2:利润由什么组成?销售额收益和成本相减
例3:销售额是单一的维度吗?不是,销售额是多个商品类目/SKU的总和
例4:地区的销售由什么组成?不同线下渠道的累加
例5:销量还能再细挖吗?可以往下深挖人均销量和购买人数
公式化的应用(四则运算的运用场景)
+:不同类别的业务叠加,按业务来确定加法。
- :常用来计算业务间的逻辑关系。
* / :是各种比例或者比率,转化率的关系。
根据结构化分析公式化
案例:
思维导图
根据结构化的思维导图进一步分析公式化的思维导图
业务化(流程化)
业务化和结构化、公式化的比较
结构化和公式化似乎已经能解决大部分问题(80%),但是还是存在漏洞、逻辑缺失,由业务化来补充。
问题:
如何预估上海地区的共享单车投放量?
从结构化+公式化分析:
分析1.从城市流动人口计算。比如:常住人口有2000w,有600w的劳务年龄乘以转化率。
分析2.从人口密度计算。市区人口面密度高,郊区人口密度低;郊区有分为居住区和商业区。
分析3.从城市交通数据计算。比如哪条地铁的哪个站点的人流量多,重点投放。
分析4.保有自行车计算。网上公开数据*转化率。
思考:以上的分析看似全面,但是却没有考虑到转化率。
因此结构化+公式化+业务化:
如何使你的分析贴合业务?
1.有没有从业务方的角度思考?
2.真的分析出原因了吗?
3.能不能将分析结果落地?跟进、监控的习惯。
例题:
一家销售公司业绩没有起色,对它进行了分析
1.销售人员的效率降低,因为士气低落。
2.产品质量不佳,和同期竞争对手比没有优势。
3.价格平平,顾客不喜欢。
用结构化+公式化拆解的这三点看似是有效的分析论点,但不是一个靠谱的、可以落地的结论。首先‘士气低落’只是一个现象,不是真正的原因;‘产品质量不佳’也是一个现象,不是真正的原因;‘顾客不喜欢’也是一个现象,不是真正的原因。要考虑的是士气为什么低落,可能是提成不高、可能是跑业务太累;产品质量不佳的原因是什么,可能是原材料偷工减料、可能是用户变挑剔了;顾客不喜欢的原因是什么,因为顾客的要求千变万化,可能是嫌价格贵等等。所以这三点都不是结论。
用结构化思考+公式化拆解,获得的最终分析点,很多时候是现象。数据是某个结果的体现,但不代表原因。
如何培养业务思维?
1.多和业务方沟通;2.多从业务方思考;3.本身最好参与到业务里
三种核心思维总结
part3:数据分析的思维技巧
三种核心思想是框架型的指引,实际应用中也应该借助思维的技巧工具。
7种方法
二八法 漏斗法 对比法 象限法 指数法 假设法 多维法
象限法:
使用象限图来分析数据,如RFM模型。
RFM模型
象限法特点
核心:象限法是一种策略驱动的思维。
优点:直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略。
应用:适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等。
须知:象限划分可以按中位数,也可以按平均数,或者是经验。
多维法:
从多个维度交叉分析数据。
比如:
1.用户统计维度:性别、年龄…
2.用户行为维度:注册用户、用户偏好、用户兴趣、用户流失…
3.消费维度:消费金额、消费频率、消费水平…
4.商品维度:商品品类、商品品牌、商品属性…
多维度细分
辛普森悖论
辛普森悖论:单看‘学院’的女生录取率42%大于男生录取率21%;但是把学院细分后,商学院的女生录取率49%小于男生录取率75%,法学院的女生录取率5%小于男生录取率10%。
多维法特点
核心:是一种精细驱动的思维。
优点:处理大数据量,维度丰富且复杂的数据有较好的效果。但是 维度过多,会消耗不少时间。
应用:只要数据齐全且丰富,均可以应用。
须知:对不同维度进行交叉分析时,需要注意辛普森悖论。
假设法:
引例:现在,马上,公司要派你去贝宁出差,如果你只能携带一个背包,你会往里面装什么东西?你为什么要忘里面装它? 答案可以有千百种,但是最恰当的回答是:虽然贝宁这个地方我不熟悉,但我假设它在非洲,那么现在我得考虑炎热的情况…
很多时候,数据分析是没有数据可明确参考的:比如新进入一个市场,公司开拓某样产品。老板让你预测一年后的销量,或者产品的数据基础非常糟糕,你拿不到数据。
在数据不足时通过假设进行推断。
案例:
案例1:公司在节日进行了一次营销活动,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节日而提高,那么怎么证明活动是有效或者无效的呢?
假设活动是有效的
1.思考一下,活动有效的话,会发生什么事情?
2.会有一定数量的用户购买,如果能证明这条,那么我们有理由相信活动是有效的。
3.用户通过活动购买商品,会发生什么可观测的行为呢?假设有一些用户会评论留言,那么可以统计提及活动的字眼。
4.当用户提及了这次营销活动,接下来的问题是,有效了多少?10%,20%?
5.假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数。
案例2:你是自营电商的数据分析师,现在想商品提价后,收入会不会有变化?你会怎么做?
1.假设商品提价后,销量一定会下跌,问题是销量下跌多少?
2.首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
3.找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚用户、普通用户、羊毛用户…
4.不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化…这些数据可以凭借经验做出假设。最后汇总。
假设法特点:
核心:假设是一种启发思考驱动的思维。
优点:当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程。
应用:它更多是一种思考方式,假设—验证—判断。
须知:不止可以假设前提,也能假设概率或者比例,一切都能假设,只要自圆其说。
指数法
思考以下问题?
1.中国今年的经济指标如何?
2.美国NBA最佳球星是谁?
3.竞争对手产品表现如何?
NBA比赛数据贡献值: (得分+篮板+助攻+抢断+封盖)-(出手次数-命中次数)-(罚球次数-罚球命中次数)-(失误次数/球员上场比赛的场次)
很多时候,我们有数据,但不知道怎么应用。就是因为缺乏了一个有效性的方向。这个方向可以成为目标指数。通过将数据加工成指数,达到聚焦的目的。
几个计算方法
1.线性加权; 2.反比例; 3.log
指数法的特点:
核心:指数法是一种目标驱动的思维
优点:目标驱动力强,直观、简洁、有效。对业务有一定的指导作用。一旦设立指数,不易频繁变动。
应用:和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工成可利用的。
须知:指数法没统一的标准,很多指数更依赖经验的加工。
二八法
1.数据中,20%的变量将直接产生80%的效果,数据分析更应该围绕这20%作文章。
2.持续关注Top N的数据,是一个很好的习惯,尤其在部分行业。
3.虽然指标很多,但往往某些指标更有价值,二八法则不仅分析数据,也能管理数据。
二八法特点
核心:二八法是一种只抓重点的思维
优点:和业务紧密相关,和KPI更紧密相关。几乎花费最少的精力就能达到不错的效果,性价比很优。
应用:二八法则存在于几乎所有的领域,所以这种分析思维没有局限。
须知:在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘。
对比法
好的数据指标,一定是比例或者比率 好的数据分析,一定会用到对比。
案例:
案例1:老王卖水果,今天卖了1000元水果,这个数据有分析价值么? 老王卖水果,今天卖了1000元,昨天卖了800元,这个数据有分析价值么? 老王卖水果,今天卖了1000元。隔壁的老马卖了2000元,这个数据分析有价值么? 老王卖水果,今天卖了1000元,昨天卖了800元,隔壁的老马昨天卖了3000元,今天卖了2000元,这个数据分析有价值么? 老王花了3000元的营销成本卖了1000元水果,这个数据分析价值么? 老王其实是王健林,他有几百亿资产,他卖水果卖了1000元,这个数据分析有价值么?
这个案例的几个例子价值都不大。
案例2:节日大促,女生消费占比从60%变为70%,女生节日爱消费:?
1.这个结论是有问题的。
2.占比提高了,不代表绝对值提高了。某商品平时销售额100万女生占60万,节日销售额80万女生占56万,女生真的消费变高了?
3.谁说节日销售额会提高?别忘了竞争对手
4.孤数不证
几种对比法:
竞争对手对比、类别对比、特征和属性对比、时间同比环比、转化对比、前后变化对比
对比法的特点
核心:对比法是一种挖掘数据规律的思考方式。
优点:对比法可以发现很多数据间的规律,它可以和任何思维技巧结合,比如多维对比、象限对比、假设对比等。
应用:对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比。
须知:在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘。
漏斗法
漏斗法主要用于分析从潜在客户到实际客户的转化过程。这种方法的核心在于逐层剖析每一步的转化率,从而找出客户流失的原因和改进的空间。漏斗法对于电商、营销等领域尤为重要,因为它能够帮助公司优化客户获取和转化流程。
漏斗法的特点
核心:漏斗法是一种流程化思考方式。
优点:单一的漏斗分析没有用,转化率20%,但是能说明什么呢? 它要和其他分析思维结合,比如多维,比如对比。
应用:涉及到变化和流程的都能用。
须知:单一的转化率没有,单一的转化率没有,单一的转化率没有。
Part4.如何在业务时间锻炼数据分析思维
01 好奇心多问自己为什么? 好奇心 为什么啤酒不尿布是错的?买了尿布的人会买啤酒,但是买啤酒的人会买尿布么? 怎么摆放啤酒?部分还是全部品类? 数据呢? 场景型的摆放是否比品类摆放更好? 尿布旁边应该摆放其他东西么?啤酒是否是最好选择?
02 生活中的练习 这个夜市一天的人流量是多少?一年的 人流量又是多少? 「现煮小卷」每天的营业额是多少? 这个夜市,哪家店的利润是最高的?它 比最低的高出多少?原因是什么? 如何从数据分析的角度提高最低店的营业额? 夜店准备弄一次活劢,如何设计一套数据评估方案评估活劢效果?
02 生活中的练习 为什么领导戒者同事丌认同这次分析? 原因是什么? 如果我的职位比现在高两级,我会去怎么分析? 让我再次分析一年前做的那个案例,我 会怎么去优化和改迚? 我的历史分析,能用三种核心思维去优 化和迭代吗?