01 | RFM定义
数据分析的主要任务就是通过数据驱动来优化业务,以实现帮助业务挣钱。实现方式主要是通过对数据的分析,针对性地优化业务中的各个板块的数据。
近几年来,精细化运营、增长黑客成为热门的词汇,其核心就是针对用户行为分析,优化用户指标。作为分析方法论,RFM模型特别具有代表性。
- R(Recency)——R 代表最近购买日期与指定日期的间隔天数
- F(Frequency)——F客户在最近一段时间内交易次数活跃度
- M(Monetray)——M客户最近一段时间内交易金额值
02 | RFM模型
- RFM模型可以对用户的价值做一个合理的预估,基于一个理想的客户特征来衡量现实中客户价值的高低
- 通过此类分析,定位最有可能成为品牌忠诚客户的群体,让我们把主要精力放在最有价值的用户身上
03 | 场景构建
生命周期(Life Cycle)的概念应用很广泛,在心理学上主要是指人的生命周期和家庭的生命周期,是指它的出生、成长过程、衰老、生病和死亡的过程。引申到用户身上就是:
- 基于"用户-场景-产品"场景来理解的话,生命周期指的就是用户从注册进入平台,购买产品 / 使用产品 这一循环过程,而用户的流失就是生命周期的结束。
- 用户生命周期,也可理解为用户从第一次购买到最后一次购买间隔的时间。
RFM分析模型可以把用户生命周期分成不同的阶段。由于行业和品类的特殊性,划分阶段的标准不是唯一的。实际上应该根据业务场景构建不同的指标体系。
为了方便理解,我们通过例子构建一个场景:
- 新生用户(R < 360,F < 4)
360 天内购买不超过 4 次,那么我们定义为新生客户。 - 有效用户(R < 360,4 ≤ F < 7)
360 天内购买了 4 到 6 次,那么我们定义为有效客户。 - 活跃用户(R < 360,7 ≤ F < 10)
360 天内购买了 7 到 9 次,那么我们定义为活跃客户。 - 忠诚用户(R < 360,F ≥ 10)
360 天内购买了 10 次或 10 次以上,那么我们定义为忠诚客户。 - 休眠用户(360 ≤ R < 720)
360 天到 720 天内没有再购买,那么我们定义为休眠客户。 - 流失用户(R ≥ 720 )
超过 720 天都没有再购买,那么我们定义为流失客户。
事实上,客户生命周期通常不像这么简单地划分。比如一些生命周期较短地互联网产品(比如手游),它的增长期可能只有最初的几个月。那么可能两周内不登陆游戏的用户就可能杯定义为休眠用户,超过1~2个月没登陆游戏的用户,基本上可以定义为流失用户
04 | 案例-user划分
1.数据集
数据集是来自kaggle的数据集
https://www.kaggle.com/regivm/retailtransactiondata
'''
1.读取数据集
'''
import pandas as pd
df = pd.read_csv(r'../input/retailtransactiondata/Retail_Data_Transactions.csv')
df.head()
# 查看trans_date的格式,发现是object,需要改为时间序列
df.info()
2.数据预处理
import datetime as dt
df.trans_date = pd.to_datetime(df.trans_date)
df.info()
# 计算r、m、f的值,先构建r值
# 通过检查最新购买的日期,来定义今天的日期
df.trans_date.min()
# Timestamp('2