常见的聚类有效性函数(内部指标)
1. 仅基于隶属的聚类有效性函数
(1) Bezdek定义的划分系数V_PC是用来度量集群之间的重叠, 划分系数的主要优点是简单,缺点是随着c的增加单调递减,与数据的本身的某一些属性没有直接关联。V_PC的值介于1/c和1之间,最大值表示聚类结果最有效。
(2) Bezdek同样将划分熵V_PE是用来度量聚类划分的模糊性,该指数与V_PC相似Bezdek证明了对于所有概率集群分区。该有效性函数的缺点也是会随着c的增加单调递减,缺乏与数据结构的连接。因此计算出的最小值表示聚类结果最有效。
(3) 改进的划分系数(V_MPC).MPC指标对V_PC存在的单调递减趋势问题进行了优化, 但是对于V_PC指标其他方面地缺陷并没有进行改进。
(4) V_P是由Chen和Linkens提出的,它是相减形式的有效性指标。它是一种只关注了隶属度的有效性函数。式中,前半部分表示数据在每一类的隶属度的最大值的和,值越大代表类内紧凑性就越好;后半部分是两个类的相似性,两个类的相似性越小则聚类效果越好。它的最大值对应最有效的聚类结果。
2. 基于几何结构的有效性函数
(1) V_XB指标是第一个将数据集的结构考虑在内的聚类有效性函数,是内类紧凑度和类间分离度的比例。显然,类间距离越大类间越离散,类内距离越小类内越紧致。因此V_XB最小值表示聚类结果最有效。
(2) Bensaid等人在1996年提出了V_SC。V_SC是簇的紧密度的和与分离度之和的比值, V_SC把类内紧凑度的衡量由整体和上的平均替换成为类内紧凑度的平均和。V_SC值越小表示聚类效果越好。
(3) V_K是由Kwon等人提出的一种有效性指标,它通过在V_XB指标的分子上添加惩罚项的方式有效克制了V_XB的递减趋势。V_K同V_XB一样,它的最小值对应最优的聚类数。
(4) V_PCAES指标是由Wu和Yang提出的相减形式的有效性指标,通过模糊隶属度函数和一个指数类型结构的中心距离的相对值来描述聚类的紧凑性和分离性
(5) …更多的介绍参考论文Combination Evaluation Method of Fuzzy C-Mean Clustering Validity Based on Hybrid Weighted Strategy下载地址论文下载地址点我
3. 有效性matlab编程
见链接各有效性函数编程