【数据分析】数据分析方法(六):相关分析 & 群组分析

本系列包含:


数据分析方法(六):相关分析 & 群组分析

1. 相关分析方法

当我们研究两种或者两种以上数据之间有什么关系的时候,就要用到相关分析。在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到多种数据。

通过计算相关系数,我们可以看到两种数据之间的相关程度。
在这里插入图片描述
相关关系不等于因果关系。在《简单统计学》中有一个例子,美国的啤酒销量和已婚人口的数量,二者的相关系数达到了惊人的 0.99。我们能说饮酒导致了婚姻?或者反过来说结婚导致了饮酒?显然,啤酒销量和已婚人口的数量没有因果关系,这纯属巧合。正确的解释应该是当人口随时间增长时,啤酒消费量、已婚人口数量也会增长。

大部分的时候是无法找到因果关系的,但是仅仅知道相关关系也能帮助我们。

2. 群组分析方法

群组分析方法(也叫同期群分析方法)是按某个特征将数据分为不同的组,然后比较各组的数据,说白了就是对数据分组然后来对比。

例如,在校上体育课的时候。体育老师考虑到男生和女生的运动项目不一样,会把男生分为一组打篮球,女生分为一组跳绳,这其实是按性别对学生进行了分组。在职场里常见的分组就是公司为了方便沟通,也会按项目建立不同的微信群。

产品会随着时间发布新的版本。产品改版的效果如何?版本更新后用户是增长了,还是流失了?

像这类问题,就需要将用户按时间分组,然后比较不同组的用户留存率。所以,群组分析方法常用来分析用户留存率(或者流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。分组后,考察每组用户的留存率随着时间发生了哪些变化,例如 1 个月后留存率是多少,2 个月后留存率是多少。对于留存率高的用户组,分析他们为什么留存;对留存率低的用户组,分析他们为什么流失。

在这里插入图片描述
在我之前的一篇博客,【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战,通过一个实际营销案例,详细介绍了用 Python 如何完成同期群分析。

  • 6
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

G皮T

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值