案例:
老板问:“好时光”的线上活动流量情况怎么样?
一.找出问题:精确使用描述性统计
精确使用描述性统计可以对样本的基本情况和特征进行说明
在日常业务中经常被使用的描述性统计量:中位数,平均数,分位数,方差/标准差,异常值
二.分析问题:找出问题,着眼于变化,寻找异常值
- 1.找出问题:精确使用描述性统计
- 2.找出问题:着眼于变化,寻找异常值
评估变化的方法
同比:对比同期变化(和上周五比)
环比:对比连续周期
增长率:可以有效评估累计型的指标
日常工作中的流量数据,用户数据,转化数据,交易数据都有固定的波动周期,每个周期内的数据变化应该是趋于稳定的,如果某天的数据不在符合预期的范围内稳定变化就是数据异常
对数据异常的敏感度主要有:数据波动是否异常?异常的范围,波动的程度,是否需要深入分析
异常值:
三个超高UV增长率的原因,一是因为周末,UV本来就高;二是因为这三天我们有合作渠道的推广,造成UV暴增
变化:
活动的峰值的增长率有向下的趋势
- 3.细分指标,多维度分析
通过多维度,拆分指标进行分析,来寻求指标变化可能的原因
同一指标,不同维度
拆解指标,深挖数据
常用的指标维度:
用户指标:地区,年龄,性别,学历,设备型号,操作系统
产品指标:产品类型
运营指标:活动类型
营销指标:营销渠道,营销方式
- 4.分析问题:交叉分析
只关注单一维度和指标会造成我们主观判断上的偏差:
- 幸存者偏差
- 维度偏差
引入转化率作为交叉分析的指标,从折线图来看,转化率和UV的关系并不大
- 5.相关性分析,找出问题关键因素
相关性分析对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素相关的密切程度。
相关性分析在数学层面很难做到严谨性,但是在业务层面具有非常大的可解释性
相关系数(相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差)
通过计算相关系数,我们发现UV和CTR之间的相关系数超过0.5,在实际业务中可以判断为强相关。
- 6.预测趋势
在业务中,我们通常通过预测性分析来判断核心业务指标的发展趋势,尽管预测性分析可以为未来的趋势提供指导,但是预测也只是一种估计,数据的质量和业务状态的稳定性决定着预测的准确性,所以这类分析往往需要持续不断的优化。
三.解决问题,促进业务落地
我们基于数据,做出了上述问题,现在我们需要去把我们的结论和分析的逻辑去和业务方落实,确保我们的分析无误且结构能够被业务方所接受