#同行分享第一篇#
非常喜欢阅读同行的文章,彷佛进行一场隔空交流。大家都是数据分析师,有许多共鸣;了解数据分析在不同行业的应用,往往很有收获。
作者在互联网大厂从事数据分析,很勤快,写了很多总结。有一些真知灼见,值得摘要。
——【9大数据分析方法】——
总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。
总结2:抓住两个关键因素:维度(类别)、指标
一、周期性分析
1.常见的周期包括2种:自然周期/生命周期。
- 自然周期:指标随时间推移而自然发生波动。
- 生命周期依据对象分为3类:商品生命周期,app生命周期,用户生命周期。参考线:时间轴+指标走势。如:第1天/第2天/第3天,天/周/月。
2.周期性分析的作用:做出一个参考曲线,为进一步判断提供依据。
二、结构分析
1.结构分析,对指标在维度上做层层拆解和对比,如用户、行业、渠道、区域、产品等维度。
2.结构分析的作用:把握结构变化情况,追踪指标走势,能快速定位问题发生点,为进一步针对性提出解决方案提供方向。
三、分层分析
1.用户分群、商品ABC分析、行业二八法则,本质就是分层分析。
2.分层分析,针对单一指标,是为了应对平均值失效的场景,如异常值、极大值等
3.设定分层的层级的方法: “二四六八十”法则
- 比平均值高的,根据平均值的2倍、4倍、6倍、、分层。
- 比平均值低的,根据平均值的1/2、1/4分层。
4.分层分析的作用:是其他分析的前哨战,做好分层,能引发更多思考和分析。
5.单一指标用分层分析,两个指标用矩阵分析,多个指标用DEA模型。
四、矩阵分析
1.矩阵分析,对两个指标各自确定一个阈值分类点,划分出4个象限,把分析对象映射到矩阵图上。阈值客观上可以取平均数,主观上可以根据专家判断、或资源承受力等。
2.矩阵分析的作用:从两个指标交叉对比种发现问题。
3.常见的KANO模型(用户需求分析)和波士顿矩阵(企业实力分析),本质就是找两个评价指标,构造交叉矩阵,对业务分类。两个指标可以是互相矛盾的(收入规模和利润)、或互相促进的(增长率和占有率)。
4.有两个场景不适合用矩阵分析,①有极值影响平均数,②两个指标高度相关。
五、指标拆解
1.常见指标关系:
- 并列关系(相互独立),如业绩=客户数x消费率x客单价
- 串行关系(前后关系),如漏斗模型最后一个指标的逆推
2.固定的指标拆解法:财务分析领域的杜邦分析(利润=收入-成本),零售行业的人货场模型。
3.指标拆解的流程:
- 找到主指标
- 找到负责主指标的部门
- 确认子指标可采集到数据
- 列车拆解公式,进行数据对比
4.指标拆解的作用:可以发现问题,解释问题。
六、漏斗分析
1.漏斗分析,可处理多个指标,指标对应业务在流程上有顺序关系。
2.漏斗分析的作用:可以看到问题发生在哪里,但无法解释。
七、相关分析
1.直接相关,即有些指标之间天然存在关系,有三种形式:
- 在结构分析法种,整体指标与部分指标之间的关系
- 在指标拆解中,主指标与子指标之间的关系
- 在漏斗分析法中,前后步骤指标之间的关系
2.间接相关。有两种常用分析方法:散点图、计算相关系数。
3.相关分析法的不足: - 相关不等于因果
- 相关分析不能解决非量化指标因素。有时候我们寻找关系的因素不能量化,如装修风格。关于非量化特征与指标的关系,用标签分析法。
4.相关分析的作用:可以解释问题、可以预测。
八、标签分析
1.标签分析,把难以量化的因素转化为标签类别,比较不同标签下指标的差异。
2.标签化要确保标准统一、达成统一认识。
3.qx感觉标签分析与结构分析有很多相似之处。
九、MECE法
1.当有太多因素影响分析不知从何入手,可以用MECE把影响因素梳理清楚。先把最大因素分离出来,再分离小的因素。由大到小,逐步剥洋葱。
2.MECE指的是相互独立、完全穷尽的分类原则,可采用二分法(A和非A)。
3.该方法的不足是,有些因素无法量化,有时候缺乏数据。
——【必备7大能力】——
能力一:理解业务
业务流程、业务动作、业务方期望的结果
能力二:梳理需求
清晰的需求要说清楚5W:
who:数据使用者
when:数据使用时间
where:数据使用场合
why:使用数据原因(做监控?找原因?做预测?)
what:具体数据格式
能力三:梳理指标体系
qx根据我的项目经验,一开始的指标比较基础,往往为了满足监控和效果统计,随着业务深入开展,需要查找指标异常原因,在分析中提炼固化一些指标。业务发生变化,如变动更复杂更多样,相应要增加指标,同时理清指标间的关系。
能力四:梳理标签体系
注意:业务部门对标签有约定俗成的说法,不同部门之间标签口径混乱不一。能沟通一致最好,不能的话出报告要备注。
能力五:选择分析方法——数据分析
预测类方法:用哪个模型?
原因类方法:从哪个角度切入?如果构建逻辑链?
检验类方法:假设是什么?从哪个角度检验?
评估类方法:从哪些角度评估更合理、全面?
能力六:设计数据实验
结合业务流程,设计实验方法,要考虑具体问题:如抽样方式、样本量等等。
能力七:输出数据报告
做好汇报,很考验综合能力。数据分析首先是描述和发现问题。异常指标往往指向对应业务的负责人/负责部门,这是个找茬的活儿啊。
业务通常会找各种理由:
- 质疑数据
- 活动不如预期、指标不达标,如“自然增长率”计算不合理,或者大环境不行
本篇整理来自微信公众号【码工小熊】。