ARI聚类效果评价指标

ARI(Adjusted Rand Index)是聚类效果的一种评价指标,它不依赖于具体聚类方法,只关注结果。先介绍了其前身RI(Rand Index),然后详细解析ARI的计算公式,指出RI的不足并阐述ARI如何提供更好的区分度。通过分析配对矩阵,解释了ARI中期望值的含义,以帮助理解ARI如何评估聚类的准确性。
摘要由CSDN通过智能技术生成

聚类效果有一个评价指标,ARI(Adjusted Rand Index)。这个指标不考虑你使用的聚类方法,把你的方法当做一个黑箱,只注重结果。可以说,是一个十分“功利”的指标。

1.Rand index

在讲ARI之前呢,先讲述一下RI,也就是rand index,从两者的名字也可以看出来,这是ARI的祖宗版。


这里,我们解释一下a,b,c,d分别代表什么。a呢就是说应该在一类,你最后聚类到一类的数量,b呢就是不应该在一类 ,你最后聚类结果也没把他们聚类在一起的数量。c和d那么就是应该在一起而被分开的和不应该在一起而被迫住在一起的。毕竟强扭的瓜不甜,c和d固然是错误的。所以从R的表达式中可以看出,我们只认为a和b是对的,这样能够保证R在0到1之间,而且,聚类越准确,指标越接近于1.

这里有一个关键性的问题,就是什么叫数量?你怎么去计算?准确的说,是配对的数量。比如说a是应该在一起而真的幸福的在一起了的数量,这显然就应该像人类一样按照小夫妻数量计算,但是我们的样本可不管一夫一妻制,任意选两个就是一个配对,所以,就是n(n-1)/2这样来计算,也就是组合数,n个当中选两个的选法。同时我们看到,分母其实是所有配对的总和,所以,我们最

### 回答1: 聚类外部评价指标NMI(Normalized Mutual Information)、AC(Accuracy)和ARI(Adjusted Rand Index)是用于评估聚类算法的指标。 首先,NMI是一种用于测量两个聚类结果之间的相似性的指标,它通过计算聚类结果和真实标签之间的互信息来量化它们的一致性。NMI的取值范围为0到1,值越高表示聚类结果与真实标签越相似。 其次,AC是一种评估聚类算法准确性的指标,它通过计算聚类结果中正确分类的样本数量与总样本数量的比例来衡量。AC的取值范围为0到1,值越高表示聚类结果越准确。 最后,ARI是一种通过比较聚类结果和真实标签之间的一致性来评估聚类算法的指标ARI的取值范围为-1到1,值越接近1表示聚类结果与真实标签越一致,值越接近-1表示聚类结果与真实标签越不一致。 这三个指标聚类算法评估中起着重要的作用。NMI可以揭示聚类结果的一致性程度,AC可以评估聚类结果的准确性,而ARI可以综合考虑聚类结果的一致性和准确性。通过使用这些指标,可以对不同的聚类算法进行客观的比较和评估,选择最合适的算法进行分析任务。 ### 回答2: 聚类外部评价指标是用来评估聚类算法结果与已知标签或人工分类之间的一致性程度。其中常用的三个评价指标是NMI(Normalized Mutual Information)、AC(Accuracy)和ARI(Adjusted Rand Index)。 NMI是通过计算聚类结果与已知类别之间的互信息来度量聚类的一致性。它将聚类结果与已知类别之间的相似性量化为一个范围在0到1之间的数值,数值越高表示聚类结果与已知类别的一致性越高。 AC是通过计算聚类结果中正确分类的样本数量除以总样本数来度量聚类的准确性。AC的取值范围为0到1之间,取值越高表示聚类结果的准确性越高。 ARI是通过计算聚类结果与已知类别之间的兰德系数来度量聚类的一致性。ARI的取值范围在-1到1之间,取值越高表示聚类结果与已知类别的一致性越好。当ARI为0时,表示聚类结果与已知类别的一致性与随机分配结果相同。 这三个评价指标可以帮助我们评估聚类算法的效果,选择合适的聚类算法或调整算法参数。在实际应用中,我们可以根据具体情况选择适合的评价指标来进行聚类结果的评估和比较,以提高聚类结果的准确性和一致性。 ### 回答3: 聚类外部评价指标NMI(Normalized Mutual Information,标准化互信息)、AC(Accuracy,准确率)和ARI(Adjusted Rand Index,调整兰德指数)是常用的评价聚类效果指标。 NMI是通过计算聚类结果与真实类别之间的互信息来衡量聚类的准确性。互信息度量了聚类结果与真实类别之间的相似程度,值越大表示聚类结果越接近真实类别。NMI的取值范围在0到1之间,值越接近1表示聚类效果越好。 AC是一种简单直观的评价指标,计算分类正确的样本占总样本数的比例。准确率越高表示聚类结果与真实类别的一致性越高,当准确率为1时代表聚类结果完全与真实类别一致。 ARI是通过计算聚类结果与真实类别之间的兰德指数,对随机聚类取值进行了修正。兰德指数度量了聚类结果中相似样本对在真实类别中也属于同一类别的程度。ARI的取值范围在-1到1之间,值越大表示聚类效果越好,如果结果为0则表示聚类结果与随机聚类结果没有差异。 综合来看,NMI、AC和ARI都是常用的聚类外部评价指标,用于衡量聚类结果与真实类别的一致性和准确性。在进行聚类结果评估时,可以根据具体的需求选择合适的评价指标进行评估。
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

钱塘小甲子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值