RFM模型是一个客户分析的经典模型,是衡量客户价值的重要工具和手段,其中R表示客户最近一次交易时间的间隔,F表示客户购买商品的总数量,M表示客户交易的金额。通常我们将这三个指标的维度分为2份,分出8种客户价值类型。在实际运用中,有时候我们并不需要分为这么多种客户类型,故本文采用K-means聚类,将客户分为适当种类型。
一、确定聚类数目
data= read.table("1.csv", header=TRUE, sep=",")
twss=NULL;
for(i in 1:10) twss=c(twss,kmeans(data,centers=i)$tot.withinss)
plot(1:10,twss,type='b',xlab='k',ylab=expression(TWSS[k]),
main = 'Within groups sum of square')
本文选取了10000个客户的历史交易数据,用RFM模型对原数据进行清洗,结束后,为确定聚类的数目,采用的方法为选取聚类数目k,使得总类内平方和TWSS尽可能的小,得到碎石图如下:
我们发现随着聚类数目增多,每一个类别中数量越来越少,距离越来越近,因此TWSS值肯定是随着聚类数目增多而减少的,所以关注的是斜率的变化,但TWSS减少得很缓慢时,就认为进一步增大聚类数效果也并不