用户划分——RMF方法
-
RMF
(recency最近一次消费、frequency消费频率、monetary消费金额):从用户的忠诚度、活跃度、土豪度刻画用户的价值。如下表分为8类,可使用Kmeans进行聚类。
-
使用KMeans聚类划分
(1)首先,计算每一位用户的 R、F、 M指标
(2)选取要聚类的特征(R、M、F)
import pandas as pd
df = pd.read_csv(r'data.csv', sep=',', encoding="utf-8") #打开csv文件
X = df[['r_c','f_c','m_c']] #选取R、M、F三列数据
(3)Kmeans聚类, 分为八个类别则设 k =8
from sklearn.cluster import KMeans
clf = KMeans(n_clusters=8, random_state=1) #构建模型
clf.fit(X) #拟合模型
result = clf.predict(X) # 模型预测
df['tag'] = result #将类别赋给df的新增tag列
df['r_c','f_c','m_c'].groupby('tag').describe() #按tag分组、对RMF进行描述性统计
(4)输出结果文件
df.to_csv(r'output.csv', index=False, sep=',', encoding='utf-8') #输出csv文件
(5)使用Excel即可查看用户的分类结果。
参考文章:https://mp.weixin.qq.com/s/m5z7YqVdBO-nBBKjIPQNmg