Python机器学习——聚类的有效性指标

本文介绍了Python机器学习中聚类的有效性指标,包括FM指数、Rand指数和ARI指数,以及聚类的内部指标如avg、diam、dmin和dcen,解释了它们的含义和作用。此外,文章还提到了Python学习路线、必备开发工具、学习笔记、实战案例和面试资源,旨在帮助读者全面提升Python技能。
摘要由CSDN通过智能技术生成

它刻画了所有属于同一类的样本对(要么在CC中属于同一类,要么在C∗C∗中属于同一类),同时在C,C∗C,C∗中属于同一类的样本量的比值。

  • FM指数(Fowlkes and Mallows Index,FMI):

FMI=aa+b⋅aa+c−−−−−−−−−−−√FMI=aa+b⋅aa+c

它刻画的是:在CC中属于同一类的样本对中,同时属于C∗C∗的样本对的比例为p1p1,在C∗C∗中属于同一类的样本对中,同时属于CC的样本对的比例为p2p2,FMI就是p1p1和p2p2的几何平均。

  • Rand指数(Rand Index,RI)

RI=2(a+d)N(N−1)RI=2(a+d)N(N−1)

它刻画的是同时隶属C,C∗C,C∗的样本对与同时不隶属于C,C∗C,C∗的样本对之和占所有样本对的比例。

  • ARI指数(Adjusted Rand Index,ARI):

ARI=RI−E[RI]max(RI)−E[RI]ARI=RI−E[RI]max(RI)−E[RI]

使用RI时有个问题,就是对于随机聚类,RI不保证接近0(可能还很大)。而ARI指数就可以利用随机聚类情况下的RI即**E[RI]**来解决这个问题.

这些外部指标性能度量的结果都在[0,1]之间,这些值越大

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值