阅读笔记0001之聊聊数据分析现状


人间清醒文-聊聊数据分析现状的阅读笔记

数据分析是干什么的?

数分工作:对数据进行分析(wrong)==>用数据进行分析(right)。区别点:数据是分析的手段,而不是分析的对象。若不明白上面这点,不先考虑问题,却把数据放在前面,有的止步于简单的描述;有的则一头扎入维度和度量交叉组合的无尽汪洋中,不知从何做起。(自己尚停留在这个阶段,却无法出来)

  • 用数据进行分析,分为四类:
    • 描述性分析,是要将业务状态以一个量化的方式完整地呈现出来。
    • 诊断性分析,是要针对一个问题探究它存在的原因。
    • 预测性分析,是要看当前状态改变或不改变的情况下,未来可能的走向是什么样的。
    • 指导性分析,是要将原有的决策量化与精细化,让数据真正成为业务动作的推动力。

文中通过大灰狼捕猎的故事阐述了理想的数据分析状态:

数据获取与指标建设
描述性分析——指标明显异常,兔子增加羊减少;指标分解,兔子转化率下降(发现兔子数据没变,但平均年龄便年轻,发情强壮,追赶不上,耗费大量时间,没时间抓羊)羊的转化率不变
诊断性分析——不再关心成对的兔子,使得兔子转化率提高 >
预测性分析——由于"缩小业务范围",食物总量下降,考虑分配更多时间抓羊。预测分配多长时间最优,根据历史数据,画出蹲守时长&抓羊数量的曲线图
指导性分析——对比抓羊、兔曲线,找到最优蹲守时长

数据分析最重要的能力?

从复杂图表里提取关键信息的能力 把数据分析师看作一个纯粹的阅读者,而不是创作者。
思考几点:

  • 为什么我要看复杂的图表,用简单的图表是不是真的无法准确描述我想分析的情境?
  • 为什么我总想着从图表“提取”信息,而不是用图表“呈现”信息?
    执着于观察已有的复杂图表,会逐渐坠入“对数据进行分析”的渊薮之中(但怎么做呢)

案例分析:
公司年度总结,需要找出年度销量上升最猛的几个片区,准备向这些地方投入资源,问如何挑选?
使用增长量还是增长率?量,不同地区可能不平权,绝对值最大的A增长1%可能高于其他地区的5%;率,基数不同,基数很小,翻很多倍从1w=>10w,相比整体的1000w其实也不大 ,如何说明其可持续呢?
==>不是一个线性问题,二维问题。两种解决方式:
1.强行降维,找到同时包含量与率的指标,足够简单有足够稳定的指标(费事)
2.画四象限图,选择合适的阈值,去量率齐高的片区(经典解法)
3.业务经验丰富,根据不同的需求,考虑实际需求的无差异曲线,让判断不生硬,主动选择偏量or偏率(好像很高级,但没懂?)
…可以复杂到无止尽:增长是长期or短期因素导致的?投入何种资源更有利?


总结:模型定式(易学),场景无限(难学)。核心能力——将具体业务问题抽象为模型化的数据问题,进行针对性的模型设计、指标设计、图表设计。理解数据、理解场景

数据分析的岗位前景

对作为技能的数据分析和作为岗位的数据分析判断是不同的。
作为技能,数据分析将是未来诸多岗位必备的技能,数据带来的精准化与精确化是难以阻挡的时代浪潮。不懂数据,相当于把对信息的感知权交给他人,凭空少了大半助力;
作为岗位,态度相对悲观,我认为数据分析师是在业务人员缺少数据分析技能这一大背景下的临时产物。
分析人员本身难以影响真实世界的业务动作,产出的成果难以量化评估,在对业务的理解方面也难与纯粹的业务人员相比。当作为技能的数据分析逐渐普及,部分没有足够门槛的数据岗位或许将逐渐消失

附录
有一只热爱数据分析的大灰狼,它决心用数据分析的方法提高它的捕食效率。
它首先考虑了捕食的几个环节,建设了一套数据收集体系,包括自己的状态、猎物的年龄、性别、种族、奔跑速度、捕食时间、捕食地点、捕食方式等;设计了几个指标,包括发现猎物的数量、追上猎物的数量、吃到猎物的数量、被抢猎物的数量、自己受伤的次数、各个捕食阶段的转化效率等。(数据获取与指标建设)
然后它设计了报表,坚持做周度呈现和复盘。(描述性分析)
它发现这个月吃到的猎物数量增加,但饱腹感下降了,于是查看了猎物的比例,发现是因为兔子增加,而羊减少了。
然后它查看猎物的转化效率,发现似乎矛盾的情况:兔子的转化率下降了,而羊的转化率不变。
为什么转化率下降了?它转而查看转化率的分子分母以及它们的特征,发现兔子的出没量大幅上升,而平均年龄向青年期靠拢。
结合它捕猎时看到的兔子们的运动姿势,它推断是兔子们到了发情期,出没的频率上升,而发情的大多是身强力壮的青年兔,奔跑起来极为神速,所以经常追赶不上。同时,追赶兔子花费了大量时间和体力,也就很少有工夫去抓羊了。
为了验证它的猜想,它设计了对照实验,不再去关心那些成对的兔子,并增加了“是否成双成对”这个字段,果然兔子的转化率回升了。(诊断性分析)
但由于“缩小了业务范围”,食物总量仍有下降,它开始考虑分配更多时间在抓羊上面。
为了预测分配多少时间最合适,它根据历史数据,画出了蹲守时长和抓羊数量的曲线图。(预测性分析)
将羊的曲线和兔子的曲线结合,它找到了最优的蹲守时长,在这一信息的指导下,它终于能吃饱了。(指导性分析)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值