Python机器学习——聚类的有效性指标

最新推荐文章于 2024-04-08 06:12:11 发布

莫晓前端资料

最新推荐文章于 2024-04-08 06:12:11 发布

阅读量1k

点赞数 25

分类专栏：程序员学习文章标签：机器学习 python 聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60226911/article/details/136860522

版权

本文介绍了Python机器学习中聚类的有效性指标，包括FM指数、Rand指数和ARI指数，以及聚类的内部指标如avg、diam、dmin和dcen，解释了它们的含义和作用。此外，文章还提到了Python学习路线、必备开发工具、学习笔记、实战案例和面试资源，旨在帮助读者全面提升Python技能。

摘要由CSDN通过智能技术生成

它刻画了所有属于同一类的样本对（要么在CC中属于同一类，要么在C∗C∗中属于同一类），同时在C,C∗C,C∗中属于同一类的样本量的比值。

FM指数（Fowlkes and Mallows Index，FMI）:

FMI=aa+b⋅aa+c−−−−−−−−−−−√FMI=aa+b⋅aa+c

它刻画的是：在CC中属于同一类的样本对中，同时属于C∗C∗的样本对的比例为p1p1，在C∗C∗中属于同一类的样本对中，同时属于CC的样本对的比例为p2p2，FMI就是p1p1和p2p2的几何平均。

Rand指数（Rand Index，RI）：

RI=2(a+d)N(N−1)RI=2(a+d)N(N−1)

它刻画的是同时隶属C,C∗C,C∗的样本对与同时不隶属于C,C∗C,C∗的样本对之和占所有样本对的比例。

ARI指数（Adjusted Rand Index，ARI）:

ARI=RI−E[RI]max(RI)−E[RI]ARI=RI−E[RI]max(RI)−E[RI]

使用RI时有个问题，就是对于随机聚类，RI不保证接近0（可能还很大）。而ARI指数就可以利用随机聚类情况下的RI即**E[RI]**来解决这个问题.

这些外部指标性能度量的结果都在[0,1]之间，这些值越大

最低0.47元/天解锁文章

莫晓前端资料

关注

25
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。