如何分析留存率？（案例：留存率堆积直方图+留存率下降分析）

最新推荐文章于 2024-07-23 16:17:50 发布

好好学习的星熊

最新推荐文章于 2024-07-23 16:17:50 发布

阅读量1w

点赞数 5

分类专栏：业务分析笔记文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_46704989/article/details/121564524

版权

本文深入探讨游戏产品的留存率分析，包括定义、留存率的3个阶段和3个要素，如何通过留存堆积直方图进行分析。同时，文章分析了留存率下降的原因，提出优化留存率的方法，如提升游戏品质、个性化体验和消息推送。最后，讨论了付费留存的概念以及留存作弊的问题。

摘要由CSDN通过智能技术生成

前言：本文内容以游戏产品为基础进行讲解，内容为以下4部分：
1. 留存率的定义、3个阶段、3个要素理解（案例：留存率堆积直方图）
2. 如何分析留存率（案例：如何分析留存率下降）
3. 如何优化留存率
4. 什么是付费留存、留存作弊

留存率的定义、3个阶段、3个要素理解（案例：留存率堆积直方图）

定义：第i天的留存率=第i天留存用户\第i天新增用户

定义时需要注意的点：

1. 讨论的留存率是否是分批次（分天）；

2. 计算的时间点要充分定义；

3. 用户群要充分定义；

留存率也可以分2类来看，按照用户性质，分为：新增用户留存率、活跃用户留存率；

新增用户留存率指标：

次日留存：次日留存用户数

三日留存：第三日留存用户数

七日留存：第七日留存用户数
案例：留存堆积直方图_python实现

针对新增用户留存指标，可以绘制留存堆积直方图：

data=pd.read_excel(r'C:\Users\EDZ\Desktop\other_data\test\data.xlsx',sheet_name='RR')
data.columns=['id','date','value']
# 如果数据只有id和登录日期两列，那么需要复制一列每个ID的min(date)，以计算每个ID对应日期是否留存
data['date']=pd.to_datetime(data['date'])
date_min=data.groupby('id')['date'].min().reset_index()
data_merge=data.merge(date_min,on='id',how='left',right_index=False) # 合并最小列
data_merge['n_day']=data_merge['date_x']-data_merge['date_y'] # 计算每个ID对应日期是否留存
data_count=pd.pivot_table(data_merge
                           ,index='date_y'
                           ,values='id'
                           ,columns='n_day'
                           ,aggfunc='count'
                          ,fill_value=0).reset_index()
data_count # 得到留存矩阵

data_rr=data_count.iloc[:,1:].shift(periods=-1,axis=1).fillna(0)/data_count.iloc[:,1:]
data_rr # 得到留存率矩阵

labels=['次日','2日','3日','4日','5日']
alpha=0.8
fig,ax=plt.subplots(1,1,figsize=(10,5))
for i in range(5):
    if i ==0:
        ax.barh(data_count['date_y'],data_rr.iloc[:,i],alpha=alpha,label=labels[i])
    else:
        ax.barh(data_count['date_y']
                 ,data_rr.iloc[:,i]
                 ,left&