它刻画了所有属于同一类的样本对(要么在CC中属于同一类,要么在C∗C∗中属于同一类),同时在C,C∗C,C∗中属于同一类的样本量的比值。
- FM指数(Fowlkes and Mallows Index,FMI):
FMI=aa+b⋅aa+c−−−−−−−−−−−√FMI=aa+b⋅aa+c
它刻画的是:在CC中属于同一类的样本对中,同时属于C∗C∗的样本对的比例为p1p1,在C∗C∗中属于同一类的样本对中,同时属于CC的样本对的比例为p2p2,FMI就是p1p1和p2p2的几何平均。
- Rand指数(Rand Index,RI):
RI=2(a+d)N(N−1)RI=2(a+d)N(N−1)
它刻画的是同时隶属C,C∗C,C∗的样本对与同时不隶属于C,C∗C,C∗的样本对之和占所有样本对的比例。
- ARI指数(Adjusted Rand Index,ARI):
ARI=RI−E[RI]max(RI)−E[RI]ARI=RI−E[RI]max(RI)−E[RI]
使用RI时有个问题,就是对于随机聚类,RI不保证接近0(可能还很大)。而ARI指数就可以利用随机聚类情况下的RI即**E[RI]**来解决这个问题.
这些外部指标性能度量的结果都在[0,1]之间,这些值越大