邓恩(dunn)指标
dunn指标指的是任意两个簇之间的最短距离除以任意一个簇种的点之间最长距离。DVI越大代表类间距越大、同时类内间距越小。
轮廓系数(Silhouettes)
样本轮廓系数
s
=
b
−
a
m
a
x
(
a
,
b
)
s=\frac {b-a}{max(a,b)}
s=max(a,b)b−a
总体轮廓系数
s
c
=
1
N
Σ
i
=
1
N
s
sc=\frac1N\Sigma_{i=1}^Ns
sc=N1Σi=1Ns
其中
a:某个样本与其所在簇内其他样本的平均距离
b:某个样本与其他簇样本的平均距离
所有样本的轮廓系数的平均值为总体的轮廓系数.
轮廓系数越接近于1聚类效果越好,越接近于-1聚类效果越差。
DB系数(戴维森丁堡指数)
- 计算第i个簇中质心到各个点的平均距离 S i S_i Si
- 计算第i个簇到第j个簇的距离 M i j M_{ij} Mij,计算所有的组合值
- 计算相似度衡量指标 R i j = S i M i j R_{ij}=\frac{S_i}{M_{ij}} Rij=MijSi
- 计算每个簇的簇内间距除以到其他簇的簇间间距,取最大值,作为 D i D_i Di
- DB系数,计算方式如下
D B I = 1 n Σ i = 1 n D i DBI = \frac{1}{n}\Sigma_{i=1}^nD_i DBI=n1Σi=1nDi