模糊C均值聚类-以RFM数据实现用户聚类【matlab实现】

RFM数据是指最近一次消费,消费频率以及消费金额,分别构成R,F,M,给定200行用户行为数据,我们用模糊C均值聚类进行分析

首先简单介绍一下模糊C均值聚类,每一个样本距各个聚类中心(初始聚类中心需要随机指定)都有一个隶属度,每一个样本至各个聚类的隶属度总和为1。

通过每次随机分配,取均值等方法,在层层迭代过程中,寻找聚类中心,使得每个样本到每个聚类中心的距离值最小化,所计算的聚类结果就是我们的目标。

MBA智库对于RFM有着详细的解释,link:https://wiki.mbalib.com/zh-tw/RFM%E6%A8%A1%E5%9E%8B

模糊C均值聚类的详细说明可以参见:https://wiki.mbalib.com/zh-tw/RFM%E6%A8%A1%E5%9E%8B

 

下面给出RFM数据

接下来我们用欧式距离定义的方法,计算用户特征向量与聚类中心的距离值:

接下来就是数据预处理,因为R,F,M分别代表的含义不同,单位也不同,因此要实现数据的无量纲化,我们采用归一化处理。即数据减去最小值,再除以最大值与最小值的差值

最后,我们设定以下参数:

即聚类数目,迭代次数,模糊系数(要求大于1),以及精度。

最后看一下各个用户(即样本数据)对于各个类别的归属度,可以直观反应用户u对N个类别的隶属度

我们用表格查看:

可见,用户1隶属于6类,用户2隶属于类别4等等。

  • 1
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值