机器学习-聚类性能度量指标

聚类性能度量大致分为两类:一,将聚类结果与某个“参考模型”进行比较,称为“外部指标”;二,直接考察聚类结果,称为“内部指标”。

外部指标主要有:Jaccard系数、FM指数、Rand指数。

对数据集D={X1,X2,...Xm},假定通过聚类算法给出的簇划分为C={C1,C2,...Ck},参考模型给出的簇类划分为C*={C1*,C2*,...Cs*}。相应的λ和λ*分别表示C和C*对应的簇标记向量。我们定义:

a=|SS|, SS={(Xi,Xj) | λi = λj,λi* = λj*,i<j}

b=|SD|, SD={(Xi,Xj) | λi = λj,λi* ≠ λj*,i<j}

c=|DS|, DS={(Xi,Xj) | λi ≠ λj,λi* = λj*,i<j}

d=|DD|, DD={(Xi,Xj) | λi ≠ λj,λi* ≠ λj*,i<j}

Jaccard系数为:

                                                               

FM指数为:

                                                      

Rand指数为:

                                                       

上述度量指标值在【0,1】区间,值越大越好。

内部指标主要有:DB指数、Dunn指数。

定义:

DB指数(越小越好):

Dunn指数(越大越好):

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值