0x00 概述
用户留存分析是互联网时代常用的一种数据分析方法。而很多快速发展的公司并没有相应的方法论沉淀,这就导致了在计算用户留存的时候会出现下面的一些问题:1)用户留存的定义不明确,不同的研发有自己的理解;2)没有保留计算过程的中间表,数据可复用程度低;3)不同研发的开发习惯不同,导致计算过程和表设计不统一。
鉴于以上问题,本文将指出一种通用的用户留存定义,并提供通用的计算流程以及具体的表结构设计。
0x01 简介
用户留存在不同的业务场景有不同的定义方式,比如说用户注册留存和用户活跃留存等。虽说定义方式不同,但大致思路和计算方式基本相同,本文将以用户活跃留存为例进行说明。
用户留存分析一般会分析两个指标:用户留存数和用户留存率。以 2048年05月12日 的留存分析为例,
-
20480512的次日留存数 = 20480512日活跃用户 交集 20480513日的活跃用户数
-
20480512的次日留存率 = 20480512的次日留存数/20480512的总活跃数
在留存分析中,除了次日留存以外,最常用的分析指标是3日留存、7日留存和30日留存。其中7日留存和30日留存可以理解为是周留存和月留存。下面是具体的定义:
3日留存率 = (第1日活跃的用户,在第3日还活跃的用户数)/第1日的活跃用户数
7日留存率 = (第1日活跃的用户,在第7日还活跃的用户数)/第1日的活跃用户数
30日留存率 = (第1日活跃的用户,在第30日还活跃的用户数)/第1日的活跃用户数
0x02 计算
首先说一下用户留存的计算难点在哪里。用户留存计算的时候,每天要刷新之前日期的数据,比如说今天数2048年5月30号,那我们今天要算出这几个指标:20480530当天活跃用户数,20480529的1日留存数,20480527的3日留存数ÿ