Fuzzy c-means (FCM)聚类算法

最新推荐文章于 2023-11-29 21:57:06 发布

算法学习者

最新推荐文章于 2023-11-29 21:57:06 发布

阅读量1w

点赞数 3

分类专栏： ML

ML 专栏收录该内容

20 篇文章 3 订阅

订阅专栏

原理
允许同一数据属于多个不同的类。该算法(developed by Dunn in 1973 and improved by Bezdek in 1981)经常用于模式识别，基于最小化

下列目标函数：

,

其中， m 是大于1的实数，u_ij 是x_i 属于类别 j隶属度， x_i 第i个测量到的d维数据, c_j 是类j的聚类中心，||*|| 表示任一测量数据与聚类

中心的相似度。

Fuzzy partitioning is 通过下列两式的更新迭代来使得上述目标函数达到极小：

,

当,时迭代停止，0< <1是迭代终止参数，k是迭代轮数。该过程收敛到J_m的一个极小值。

算法由下列步骤组成：

初始化隶属度矩阵U=[u_ij] , U⁽⁰⁾
第k轮迭代: 计算中心向量 C^(k)=[c_j] with U^(k)
更新隶属度矩阵 U^(k) , U^(k+1)
If || U^(k+1) - U^(k)||< then STOP; otherwise return to step 2.

说明
如前所述，数据属于某个类是由隶属度函数确定的，这正是该算法的模糊行为的体现。在该算法中用一个由0和1之间元素组成的矩阵表达

对象与类别的隶属关系。
举一个一维的例子来说，给定一个特定数据集，分布如下图：

从图中可以很容易分辨出两类数据，分别表示为‘A’ and ‘B’. 利用前述的k-means 算法，每个数据关联一个特定的质心，隶属度函数

如下所示：

利用FCM 算法，同一个数据并不单独属于一个分类，而是可以出现在中间。在这个例子中，隶属函数变得更加平滑，表明每个数据

可能属于几个分类。

上图中，红色点表示的数据更可能属于类别B，而不是A， ‘m’ 的值0.2表明了数据对A的隶属程度。现在，不用图表示，我们引入

一个矩阵，其元素取自隶属函数：

(a) (b)

矩阵的行数和列数取决于数据和类别的个数，确切的说，行数表示数据个数，列数表示类别个数，矩阵元素表示为 u_ij.
上面的例子中，我们考虑了k-means (a) and FCM (b) 的例子，可以看出在第一个例子(a) 中的稀疏总是二值，表明每个数据只能属于一个

分类，其他属性表示如下：

参考文献

J. C. Dunn (1973): "A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters",
Journal of Cybernetics 3: 32-57
J. C. Bezdek (1981): "Pattern Recognition with Fuzzy Objective Function Algoritms", Plenum Press, New York
Tariq Rashid: “Clustering”
http://www.cs.bris.ac.uk/home/tr1690/documentation/fuzzy_clustering_initial_report/node11.html
Hans-Joachim Mucha and Hizir Sofyan: “Nonhierarchical Clustering”
http://www.quantlet.com/mdstat/scripts/xag/html/xaghtmlframe149.html

算法学习者

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。