模糊聚类有效性指标(一)

在聚类时,有时我们不知道一个数据的最佳聚类数,在这个博客中给出验证聚类的有效性指标。

1. Xi e一 Beni指标XB (Xi e & Beni, 1991年)

XB指标寻找类内紧凑度和类间分离度之间的某个平衡点。
这里写图片描述
其中
类内紧凑度 = 该公式分子部分/样本数m,越小越好。
类间分离度 = 该公式分母部分*样本数m,越大越好。
XB指标计算结果越小,聚类效果最好。

2. 划分系数与划分熵

划分系数:表示所有模糊类集合所 对应的数据集是紧致的,有唯一的分类,当划分系数达到最大值是聚类效果最好。但是实验结果表明划分系数最大并非总是对应最佳的分类数,不适用于场景较复杂的数据集中。
这里写图片描述

该指标的取值范围是[1/c, l]。指标值越接近1, 聚类就越明确;指标值越接近I /C, 聚类就越模糊。该指标只和隶属度有关, 和数据的其他属性缺乏直接的联系。 并且随着C 的增加单调下降。
另一个与此似的指标是划分熵:
这里写图片描述
当划分熵 达到最大值时划分效果最佳。
Bezdeck 证明 对所有的随机聚类分割, 下列关系式成立:
0<=1-PC(c)<=PE (c)。

  • 3
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值