数据分析系列:分布分析法&用户留存分析法

本文部分内容来自数据分析(4):分布分析法&用户留存分析法,并在此基础上加入看了一些自己的理解和看法。

一、分布分析法

原文总结了几种划分方式,具体的划分还是需要根据所在的业务来考虑。必须我们在考虑支付宝支付的人群,不仅要考虑地域、年龄、等划分。还可以根据使用渠道(扫码、线上购物、线上跳转等渠道)、使用方式(PC, APP等)等其他方式划分。只要能想到的方面,并且该方面对业务改进可以起到作用,就可以设计对应的划分方式

其实这是一种统计学的思想,我们知道可以利用数据的统计信息近似代替原始数据信息(比如均值),这样的好处是简单,我们不需要每次使用原始数据,并且统计量之间放方便比较和观察。但缺失点是对一些分布,使用不完全统计量(对应完全统计量)会随时一部分数据信息。为了尽可能保留信息,我们需要从多个角度去统计我们的数据。比如我们利用0.1,0.2…0.9的分位数所包含信息要比只用中位数包含的信息多。

类似的道理,我们有一个大的人群,我们按照不同的角度去讲人群划分,对每个人群都计算对应统计量,则这些统计量比只用原始整体人群的统计量包含信息更多,并且这些统计量之间是可以相互比较的。

1. 常见的群体划分有哪些?

(1)按事件的频率

举个栗子:某职业技能提升平台(下图)的某公开课程的页面,我们不止可以看PV,还可以把PV以用户浏览的次数进行查看,可以看看有多少人是看了1-3次,有多少人看了3~5次的。

分布分析方法不同的是:平时我们只看此页面一共浏览了多少次,这样再去平均。在这里我们看到的只是一个平均数,可能很多用户一天就能看几十次,也有部分用户只看了一次,如果我们单独去看整个页面的浏览次数,是得不到用户真实的使用情况的。如果用分布分析去看用户的浏览次数,那么,我们就对这个页面的浏览次数有了一个清晰的认知。
在这里插入图片描述
(2)按一天内的时间分布
还以上面的某职业技能提升为例:上面说到查看次数,但是这个是课程的页面,我们不只要看查看次数,还要查看观看课程的时长,比如同样是看一次,有的用户看1小时,有的用户看3小时,这显然是不一样的。
在这里插入图片描述
(3)按消费金额的区间
最后呢,我们还可以按消费金额的区间进行划分,我们是一个职业技能提升平台网站,肯定有不同的用户购买不同的课程。

这里我们不仅可以从订单的笔数进行查看,还可以按消费金额划分区间,这样就可以知道我们这个平台消费0500元的有多少用户,5001000元的有多少用户,1000~2500元的用户有多少。
在这里插入图片描述
以上是分布分析法的三种主要分析方式,它的运作原理是:从事件在不同维度中的分布来观察,以便理解该事件除了累计数量和频次外,其他维度的信息。

2. 有哪些适用场景?

场景一:用户分群
已经知道一群用户完成了指定事件,但需要对用户群体进行细分,按不同的维度(比如依赖程度)和价值(付款金额)将他们划为不同群体,分别进行后续的维护或分析。

比如说:把特别依赖的用户单独筛选出来,建一个用户运营的专项项目,去运营用户。也可以把那些付款金额大的用户,去做一些运营活动。

场景二:事件分析
已经知道单个事件的完成次数,希望知道这些次数拆分到不同维度上后的分布情况,以便更清晰地了解该事件的完成情况。

比如:把不同的内容的查看次数放在一些对比,可能没有区别,但如果把几种内容的查看次数按照时间进行分布,可以看到更多详情的信息,比如某内容用户的查看时间段,A内容上午查看的用户多,B内容下午查看的用户多。

由此,我们可以发现,不同的内容在时间的分布上是有些特性的。这时候,在推荐内容上就可以根据不同的时间段推荐不同类型内容给用户。

二、用户留存分析法

提高用户留存是产品运营的一个重要目标。一个产品的正常发展思路可以总结为:提高用户黏性(留存。使用频率等)——>提高用户量(产品活动营销、用户自传播等)——>创造营收,其中提高用户留存是非常重要的一步。个人感觉最近的XX咖啡事件的有一部分因素就是只着重与提高用户量,而没有进行用户黏性提高,而导致的用户质量不佳,无法真正创造营收

又比如,我们要估计一个产品的DAU。DAU可以表示为“当天的新增用户和此前每一天新增用户在当天的留存用户之和”,基于此,我们可以用一个很简单的公式表达日活。
D A U ( n ) = A ( n ) + A ( n − 1 ) R ( 1 ) + A ( n − 2 ) R ( 2 ) + … … + A ( 1 ) R ( n − 1 ) DAU(n)=A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1) DAU(n)=A(n)+A(n1)R(1)+A(n2)R(2)++A(1)R(n1)

其中, D A U ( n ) DAU(n) DAU(n)为第 n n n天的日活, A ( n ) A(n) A(n)为第n天的新增, R ( n − 1 ) R(n-1) R(n1)为新增用户在第 n − 1 n-1 n1天后的留存率。如果我们假设,每日用户的新增是一个固定的数值 A A A,则公式可简写为:
D A U ( n ) = A ( 1 + R ( 1 ) + R ( 2 ) + … … + R ( n − 1 ) ) DAU(n)=A(1+R(1)+R(2)+… …+R(n-1)) DAU(n)=A(1+R(1)+R(2)++R(n1))

决定DAU的因素主要是用户增量,一个是用户存活,而存活往往可以代表一个产品的质量

1. 为什么要看留存?
短期来看:了解某一渠道的质量,一般看的是日留存

以天为单位,衡量这个渠道来的用户当下&接下来的表现。这里需要注意的是:以【 X日日留存】作为比较标准时,应避免其他日数据的干扰。长期来看:观察整个大盘,通常看的是周留存/月留存以周/月为单位,衡量产品的健康情况,观察用户在平台上的黏性是怎样的。记得务必要去重。

下面这款产品就是在一年的周期内,从1月份到12月份的新增用户,在后面几个月内留存的表现情况。

由下图可以看出,在产品不断的优化及迭代的过程中,每个月的留存是有所增长的,这证明此款产品的迭代和运营的方向是抓的比较准的。
在这里插入图片描述

思考一下:为什么在验证产品长期价值时选择月留存,而不是日留存呢?

这是因为留存这个数据本身波动都不太大,如果看日留存会有很多的数据需要处理,数据量大往往我们就不能把焦点放在该放的地方。而恰恰也刚好是我们一般迭代一个版本是半个月或者一个月,往往能从根本上影响留存的。

所以,从一个月来观察产品的留存变动,更能了解产品长期价值的变动。这种是最常见的留存计算方式。

2. 留存的计算方式
(1)常见的计算方式

大盘留存的计算方式:将某一时间的用户ID与另一时间的用户ID做交叉去重。

但是,大盘的留存会受很多因素的影响。举个简单的栗子:你的产品做了一个活动,引入了低质量的渠道(这是经常有的事儿哈),那么这个留存不管是次日/次周/次月都会大跌的。

还有一种可能是你搞这个活动的时候,这批低质量渠道过来的用户暴增,导致服务器宕机等等。所以,不管是产品还是运营,抑或是技术、市场每一个环节都会对留存造成影响。

(2)精准留存

精准留存有两种计算方法:第一,过滤进行过指定行为的用户ID,单独进行计算。

举个栗子:某在线阅读类产品,以下是大盘的留存,在这里呢我们要区分出来看了某一种类型的书籍的用户,有没有可能比其他的用户更有可能留下来。

这时需要把看过某一类型的书籍(比如励志类的)单独的筛选出来,只看这一批用户的留存情况。经过查看得知,此类型书籍的用户的留存比大盘高,那是不是表明还有其他类型的书籍比大盘要低啊。

所以,通过这样的观察,我们就可以得知各个类型的书籍吸引用户的能力是不一样的,然后去评判不同的书籍类型的运营质量,以及用户黏性的价值。
在这里插入图片描述
第二,根据用户不同的属性,划分为不同的群体,观察它们之间留存的区别

举个栗子:我们是王者农药的产品经理,如果通过大盘来观看数据,是看不出所以然的。这个时候我们可以给用户划分为不同的用户群体,在这里我们把用户进行分区划分,通过分区我们可以发现,有的区它的周留存是优于其他区的,那我们就可以研究这个区为什么做的好,然后把这个区做的好的点复制到其他区域。
在这里插入图片描述
最后一张架构图总结一下
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值