聚类算法的评价指标

邓恩(dunn)指标

dunn指标指的是任意两个簇之间的最短距离除以任意一个簇种的点之间最长距离。DVI越大代表类间距越大、同时类内间距越小。

轮廓系数(Silhouettes)

样本轮廓系数
s = b − a m a x ( a , b ) s=\frac {b-a}{max(a,b)} s=max(a,b)ba
总体轮廓系数
s c = 1 N Σ i = 1 N s sc=\frac1N\Sigma_{i=1}^Ns sc=N1Σi=1Ns
其中
a:某个样本与其所在簇内其他样本的平均距离
b:某个样本与其他簇样本的平均距离
所有样本的轮廓系数的平均值为总体的轮廓系数.
轮廓系数越接近于1聚类效果越好,越接近于-1聚类效果越差。

DB系数(戴维森丁堡指数)

  1. 计算第i个簇中质心到各个点的平均距离 S i S_i Si
  2. 计算第i个簇到第j个簇的距离 M i j M_{ij} Mij,计算所有的组合值
  3. 计算相似度衡量指标 R i j = S i M i j R_{ij}=\frac{S_i}{M_{ij}} Rij=MijSi
  4. 计算每个簇的簇内间距除以到其他簇的簇间间距,取最大值,作为 D i D_i Di
  5. DB系数,计算方式如下
    D B I = 1 n Σ i = 1 n D i DBI = \frac{1}{n}\Sigma_{i=1}^nD_i DBI=n1Σi=1nDi
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值