基于RFM模型的用户价值的数据分析报告
分析背景与目的
目前企业的业务逐步从产品为主导转向以客户的需求为主导。一种全新的”以客户为中心“的业务模式正在形成并提升的前所未有的高度。然而与客户保持关系需要花费成本,企业所拥有的客户只能一部分为企业带来利润。企业的资源也是很有限的,忽视高潜力的客户而对所有客户都提供同样的服务,将使企业的资源利润无法发挥其最大效用去创造最大化的利润。那么如何进行客户价值分析,甄选出有价值的客户,让企业精力集中在这些客户上,有效地提升企业竞争力是企业获得更大的发展。
在用户价值领域,最具有影响力并得到实证验证的理论与模型有:用户终生价值理论、用户价值金字塔模型,策论评估矩阵分析法和RFM客户价值分析模型等。本次分析将用到客户价值RFM模型进行分析。
为网上获得的用户交易数据原文连接为https://blog.csdn.net/NIeson2012/article/details/50150521。 为Excel文件。
分析思路
(1) 对得到的数据进行数据清洗,特征的构建和数据标准化
(2) 基于RFM模型,使用K-Means算法进行客户分群。
**(3) 基于RFM模型,使用Excel对用户进行分群。
(3) 针对模型得到的价值不同的客户采用不同的营销手段,以提供定制化服务。
分析报告正文
基于RFM模型,使用K-Means算法
预处理客户数据
该数据集共有26600多条数据,包含记录ID(数据库的primarykey)、客户编号、收银时间、销售金额、销售类型共5个字段:
通过简单的筛选,可以看到,在交易金额中有0消费额,有负数消费额,继续查看交易类型,发现为“赠送”和“退货”所造成。这些数据在本次分析中用不到,所以在数据处理时进行丢弃处理,并且字段名称重新命名,方便后续处理时间格式也需要进一步简化为yyyy-mm-dd格式,具体方法如下:
- ‘记录ID’:‘numid’,‘客户编号’:‘useid’,‘收银时间’:‘time’,‘销售金额’:‘amount’,‘销售类型’:‘type’。
- 丢弃销售金额为小于等于0的记录(丢弃销售类型为‘赠送‘和’退货’的记录)。
- 去掉时间中时分秒的部分。
from datetime import datetime
//重命名
df.rename(columns={
'记录ID':'numid','客户编号':'useid','收银时间':'time','销售金额':'amount','销售类型':'type'}, inplace = True)
//更改时间格式
df['time'] =df['time'].apply(lambda x:datetime.strftime(x,'%Y-%m-%d'))
//删除无效数据,同时index重新计数
df