模糊C均值聚类
重要的几个参数:类别数,聚类中心,迭代次数。
用隶属度确定每个数据点属于某个聚类的程度。
一个数据集的隶属度的和等于1:(1)
目的是使划分到同一簇的对象之间的相似度最大,而不同簇之间的相似度最小。
目标函数:(2)
隶属度函数是表示一个对象隶属于集合A的程度的函数
聚类中心公式如下:
(3)
(4)
模糊C均值聚类算法是一个简单的迭代过程。
步骤1:用值在0,1间的随机数初始化隶属矩阵U,使其满足式(1)中的约束条件
步骤2:用式(3)计算c个聚类中心ci,i=1,…,c。
步骤3:根据式(2)计算目标函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,则算法停止。
步骤4:用(4)计算新的U矩阵。返回步骤2。
上述算法也可以先初始化聚类中心,然后再执行迭代过程。