机器学习笔记-聚类算法K-means和FCM的学习小结

        K-means与FCM都是经典的聚类算法,K-means是排他性聚类算法,即一个数据点只能属于一个类别,而FCM只计算数据点与各个类别的相似度。可理解为:对任一个数据点,使用K-means算法,其属于某个类别的相似度要么100%要么0%(非是即否);而对于FCM算法,其属于某个类别的相似度只是一个百分比。

        两个算法的思想都可归结为求一个相似度对象函数的最小值。设X是一个有n个元素的d维数据集合:,将其聚为k类(或C类)。

        K-means对象函数的数学模型为:。其几何含义是设定k个子集,每个子集都有一个质心,求得集合中所有点到质心的距离之和,所有这些距离之和就是J。每一次迭代就是计算子集的质心,以及哪些数据点归属到中,迭代结束的依据就是的归属不再发生变化。其中是选定的一种距离描述算法,用于描述某数据点到质心的距离,一般选用闵式距离。

        FCM对象函数的数学模型为:。其数学含义是设定C个子集的质心,集合X中每一个数据点归属到子集的概率是,m是任意大于等于1的实数的权重指数(m取值的研究这里不涉及),可以是任意表示数据点与子集的相似度算法,算法迭代的过程就是求得归属概率以及质心,迭代终止的依据是需要设定一个终止值,使得,即第k轮与第k+1轮迭代求得的差距的最大值要小于,其几何含义将使得最小或位于马鞍形的位置。

        质心的算法公式:,即对于某一类别j,计算所有数据节点与其归属概率(加权)的乘积之和再和归属概率(加权)之和的比值。


        归属概率的算法公式:,即数据点与质心的相似度(加权)和与其他类别质心的相似度(加权)的比值之和。



         的性质有:1) ,概率可能是0~1之间的任意实数;2) ,对于任意数据点,其归属到所有类别的概率之和为1;3) ,对于任意类别,任意数据数目,所有数据点归属于该类别的概率之和小于数据点的总数,但总是大于0。

        将K-means与FCM算法使用矩阵表示,性质如下:



对于K-means算法,每一行只会有一个元素为100%,其他均为0,对于FCM算法,每一行的归属概率之和为100%。


参考:

http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/cmeans.html







  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值