1.基础知识
1)数据的读取和写入(DataFrame对象)
pd.read_excel(io,sheet_name)函数; io是Excel文件路径或文件对象. sheet_name是Excel文件工作表名称
pd.to_excel(excel_writer,sheet_name,index=’ ')函数. excel_writer是Excel文件路径或者文件对象,sheet_name是Excel文件工作表名称,index是决定是否加入行索引,默认为True,写入行索引。
2)数据的类型转换
s/df.astype(dtype),参数表示要转换成为的数据类型。 eg:data[‘英语’].astype(int)
3)数据批量转换
s/df.replace(to_replace):参数可以为字典。可对所有列指定数据批量替换;可对指定列指定数据批量替换。 eg:dict={‘难’(查找):‘男’(替换),‘蓝球’:‘篮球’}
2.RFM模型(客户关系管理)
1)含义
R:最近一次消费(Recency)
R值越小,用户活跃度越大
F:消费频率(Frequency),代表兴趣度大
F值越大,用户忠诚度越大
M:消费金额(Monetary)
M值越大,用户购买力越大
这三项数据成为了衡量客户价值和客户创利能力的重要工具和手段。
2)RFM模型使用步骤
计算R 、F、 M的值。
根据R、F、M的阈值,对用户进行分类。
模型构建过程中的注意事项:
不一定有完整的RFM数据,需要自行处理计算
选择计算平均数来获取阈值的方式,容易受极值影响,可选择计算中位数,,容易受数据分布密集程度的影响,可选择分区域评分,再计算平均值。
布尔值有乘法运算,与1乘得1(True),与1乘得0(False)
df.map()方法将df.[‘列1’]这一列得每个数据作为x传入到map_judge函数中,def map_judge(x):,之后再对每一个数据进行判断,替换。
用户分类规则表
用户分类 | R值价值 | F值价值 | M值价值 |
---|---|---|---|
重要价值用户 | 高 | 高 | 高 |
重要发展用户 | 高 | 低 | 高 |
重要保持用户 | 低 | 高 | 高 |
重要挽留用户 | 低 | 低 | 高 |
一般价值用户 | 高 | 高 | 低 |
一般发展用户 | 高 | 低 | 低 |
一般保持用户 | 低 | 高 | 低 |
一般挽留用户 | 低 | 低 | 低 |
拓展:AARRR模型
A:Acquistion(获取用户)
A:Activation(激活用户)
R:Retention(提高留存)
R:Revenue(增加收入)
R:Referral(推荐)