1. 理解数据分析
在工作上,数据分析就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策。
数据分析在企业的日常经营分析中主要有三大作用------现状分析、原因分析和预测分析。
现状分析就是告诉你在短暂的过去发生了什么,一方面让你了解企业现阶段的整体运营情况,好坏的程度如何,另一方面告诉你企业各项业务的构成,了解各项业务的发展及变动情况。现状分析一般通过日报、周报、月报等形式。
原因分析则告诉你某一现状为什么发生。原因分析一般通过专题分析,确定特定数据指标下降的具体原因,对运营策略做出调整与优化。
预测分析是预测将来会发生什么。在了解企业经营现状和问题出现的原因后,有时还需对企业未来发展趋势做出预测,为制订企业运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
2.顶层数据分析思维
2.1 业务化
你的分析贴合业务吗?
常见误区:重点:落地,贴合业务,可复用
2.2 结构化
金字塔思维
核心观点:以假设、问题、预测或原因作为核心论点
结构拆解:自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系。
MECE: 分论点之间相互独立,完全穷尽(MECE)。
可验证:核心论点和分论点都应该是可量化的,用数据说话
例子:
2.3 公式化
•指标是评价和衡量业务的标准
•将指标通过算法拆解
•利用加减乘除来量化分析的指标
2.4 多维化思维
2.5 穆勒五法思维
2.5.1 求同法
如果各个不同场合,除一个条件相同外,其他条件都不同,那么,这个相同条件就是某被研究现象的原因。
适用于:交叉分析,对比分析,多应用于广告投放,从投放时间、广告内容、活动形式等不同的角度,去深入对比,或交叉分析这些广告情况。
2.5.2 存异法
如果这两个场合除一点不同外,其他情况都相同,那么这个不同点就是这个现象的原因。
适用于:ABtest,需要保证两组中只有一个单一变量,还要对结果进行假设检验,防止出现第一类错误和第二类错误。
2.5.3 共用法【求同存异共用】
如果仅有某一情况在被研究现象存在的若干场合中出现,而在被研究现象不存在的若干场合中不出现,那么这一情况是被研究现象的原因或结果或必不可少的部分原因。
多应用于广告投放
1.找出正样本和负样本
2.找出正样本普遍存在的一些因素,进行求同
比如关键字带有“失分”的视频
3.找出负样本普遍存在的一些因素,进行求同
4.比较正负样本,进行求异。
若负样本没有“失分”关键字,说明它对于广告转化率有提升作用
多应用于广告投放
1.找出正样本和负样本
2.找出正样本普遍存在的一些因素,进行求同
比如关键字带有“失分”的视频
3.找出负样本普遍存在的一些因素,进行求同
4.比较正负样本,进行求异。
若负样本没有“失分”关键字,说明它对于广告转化率有提升作用
2.5.4 共变法
在其他条件不变的情况下,如果某一现象发生变化另一现象也随之发生相应变化,那么,前一现象就是后一现象的原因。
多应用于:相关分析,逻辑回归、相关系数等
假设课程售价和退费率有相关关系
2.5.5剩余法
已知每一个被研究对象都已知是由另一个复合原因引起的,那么这个现象的剩余部分就是复合原因中剩余部分的结果。
3. 常用数据分析指标和术语
平均数与方差、绝对数与相对数、百分比与百分点、频数与频率、比例与比率、倍数与番数、同比与环比。
4. 数据分析六步曲
4.1 确定分析思路
常用数据分析方法论
方法论是什么?–主要是数据分析思路,用于指导数据分析师进行一次完整的数据分析、
有哪些常用的方法论
PEST分析法(政治、经济、技术、社会)
5W2H分析法
逻辑树分析法
4P营销理论
用户行为理论
4.2 数据收集
理解数据–字段与记录
4.3 数据处理
数据清洗
重复数据处理、缺失数据处理(样本平均值代替、统计分析模型得到、删除有缺失值的记录)、检查数据逻辑错误
数据加工
数据抽取、数据计算、数据分组、数据转换
4.4 数据分析
数据分析方法
10种数据分析方法
对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、漏斗图分析法、矩阵关联分析法、高级数据分析方法
4.4.1 对比分析法
将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。对比分析常用有以下几个维度:
A.与目标对比
B.不同时期对比
C.同级部门、单位、地区对比
D.行业内对比
E.活动效果对比
4.4.2 分组分析法
根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型进行研究,分组法必须与对比法结合运用。
4.4.3 结构分析法
结构分析法是指被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。结构相对指标的计算公式为:
结构相对指标(比例)=(总体某部分的数值/总体总量)*100%
例如,市场占有率=(某商品销售量/某商品市场销售总量)*100%,市场占有率高,表明企业运营状况好,竞争能力强,在市场上占据有利地位。
4.4.4 平均分析法
平均分析法是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。
平均指标有算数平均数、调和平均数、几何平均数、众数和中位数,最常用的是算数平均数,算数平均数=总体各单位数值的总和/总体单位个数。
4.4.5 交叉分析法
交叉分析发通常用于分析两个变量之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格中,使各变量值成为不同变量的交叉节点,形成交叉表,从而分析交叉表中变量间的关系。
4.4.6 综合评价分析法
它的基本思想是将多个指标转化为一个能反映综合情况的指标来进行分析评价,主要有5个步骤:
数据标准化:去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能进行比较和加权。最典型的是0-1标准化和Z标准化。
0-1标准化:第N个经标准化处理的值=(第N个原始值-最小值)/(最大值-最小值)
4.4.7 权重确定方法
常见的有专家访谈法、层次分析法、主成分分析法、回归分析法,这里介绍一种较简单的权重确定法,即目标优化矩阵表。
具体用法为:将纵轴上的项目依次与横轴上的项目对比,由专家进行投票表决,如果纵轴上的项目比横轴的重要,那么在两个项目相交的格子中填1,否则填0,最后将每行数字相加,根据合计的数值进行排序。
4.4.8 漏斗图分析法
漏斗图是一个适合业务流程较规范、周期较长、各流程环节设计复杂业务过程比较多的管理分析工具。漏斗图是对业务流程最直观的一种表现形式,也最能说明问题所在。通过漏斗图很快能发现业务流程中存在问题的环节。
例如漏斗图用于网站中某些关键路径的转化率的分析,不仅能显示用户从进入网站到实现购买的最终转化率,同时还能展示整个关键路径中每一步的转化率。
4.4.9 矩阵关联分析法
矩阵分析法是根据产品、服务的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。
将要分析的每个事物对应投射到这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而分析每一个事物在这两个属性上的表现。
5.用户分层
A.象限图
第一步,确定某个主题。
第二步,确定主题相关的两个属性。
第三步,生成四个象限,一个矩阵
第四步,分析四个象限的定位作用。
B. RFM模型