- FCM算法来源
聚类方法是一种研究数据结构的推导工具,可用于无监督模式识别技术、数据挖掘技术等。一般将聚类分为层次聚类和划分聚类。层次聚类算法产生一个嵌套聚类的层次,算法最多包含N步,在第t步,执行的操作就是在前t-1步的聚类基础上生成新聚类。划分聚类是基于目标函数的一种聚类方法。另一方面,可以将聚类分成hard和fuzzy两种聚类类型。这两种聚类方式均是基于隶属度来描述的。隶属度的概念是从模糊集理论中引申出来的,简单的应用就是性别问题,一个人的性别只能是男(0)和女(1),没有介于0-1之间的第三种或者第几种性别。传统的硬聚类隶属度只有0和 1两个值,也就是说一个样本只能属于一个类。而模糊聚类的隶属度取值介于[0-1]。
模糊聚类可以分为3个分支:(a)基于模糊关系[1];(b)基于模糊规则学习[2];(c)基于目标函数最优。FCM 算法在1981年由Bezdek提出[3]。显然,FCM是属于基于目标函数最优的聚类方法。
2. 算法思想
假定数据集为X,如果把这些数据划分成c类的话,那么对应的就有c个类中心为C,每个样本j属于某一类i的隶属度为uij,那么定义一个FCM目标函数(1)及其约束条件(2)如下所示:
我们想要得到min{J(U,V)},