数据分析-大框架1

案例:

老板问:“好时光”的线上活动流量情况怎么样?

一.找出问题:精确使用描述性统计

精确使用描述性统计可以对样本的基本情况和特征进行说明

在日常业务中经常被使用的描述性统计量:中位数,平均数,分位数,方差/标准差,异常值

 

二.分析问题:找出问题,着眼于变化,寻找异常值

  • 1.找出问题:精确使用描述性统计

  • 2.找出问题:着眼于变化,寻找异常值

评估变化的方法

同比:对比同期变化(和上周五比)

环比:对比连续周期

增长率:可以有效评估累计型的指标

日常工作中的流量数据,用户数据,转化数据,交易数据都有固定的波动周期,每个周期内的数据变化应该是趋于稳定的,如果某天的数据不在符合预期的范围内稳定变化就是数据异常

对数据异常的敏感度主要有:数据波动是否异常?异常的范围,波动的程度,是否需要深入分析

异常值:

三个超高UV增长率的原因,一是因为周末,UV本来就高;二是因为这三天我们有合作渠道的推广,造成UV暴增

变化:

活动的峰值的增长率有向下的趋势

  • 3.细分指标,多维度分析

通过多维度,拆分指标进行分析,来寻求指标变化可能的原因

同一指标,不同维度

拆解指标,深挖数据

常用的指标维度:

用户指标:地区,年龄,性别,学历,设备型号,操作系统

产品指标:产品类型

运营指标:活动类型

营销指标:营销渠道,营销方式

  • 4.分析问题:交叉分析

只关注单一维度和指标会造成我们主观判断上的偏差:

  • 幸存者偏差
  • 维度偏差

引入转化率作为交叉分析的指标,从折线图来看,转化率和UV的关系并不大

  • 5.相关性分析,找出问题关键因素

相关性分析对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素相关的密切程度。

相关性分析在数学层面很难做到严谨性,但是在业务层面具有非常大的可解释性

相关系数(相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。

简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。

其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差

通过计算相关系数,我们发现UV和CTR之间的相关系数超过0.5,在实际业务中可以判断为强相关。

  • 6.预测趋势

在业务中,我们通常通过预测性分析来判断核心业务指标的发展趋势,尽管预测性分析可以为未来的趋势提供指导,但是预测也只是一种估计,数据的质量和业务状态的稳定性决定着预测的准确性,所以这类分析往往需要持续不断的优化。

三.解决问题,促进业务落地

我们基于数据,做出了上述问题,现在我们需要去把我们的结论和分析的逻辑去和业务方落实,确保我们的分析无误且结构能够被业务方所接受

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值