聚类分析 | 聚类有效性评价指标外部NMI(MATLAB)

指标解释

聚类有效性评价指标中的外部NMI(Normalized Mutual Information,归一化互信息)是一种常见的外部有效性指标,用于评估聚类结果与真实标签之间的相似度。NMI从信息论的角度出发,衡量两个聚类结果的共享信息量。

NMI的计算基于聚类结果和真实标签之间的互信息以及各自的熵。互信息表示两个随机变量之间的共享信息,而熵则衡量随机变量的不确定性。NMI的取值范围为[0,1],值越大表明聚类结果与真实标签的共享信息越多,即聚类效果越好。

具体来说,设实验结果为X,真实结果为Y,NMI的计算公式如下:

NMI(X,Y) = (2 * I(X,Y)) / (H(X) + H(Y))

其中,I(X,Y)表示X和Y之间的互信息,H(X)和H(Y)分别表示X和Y的熵。

NMI的优势在于它能够有效地评估聚类结果与真实标签之间的相似性,即使当聚类结果的簇数量与真实标签的类别数量不一致时,NMI仍然能够提供有意义的评估结果。此外,NMI对于噪声和异常值也具有一定的鲁棒性。

然而,需要注意的是,NMI的计算依赖于真实标签的可用性。在实际应用中,往往很难获得完全准确的真实标签,这可能会影响NMI的评估结果。此外,NMI对于聚类结果的粒度也可能较为敏感,即对于不同粒度的聚类结果,NMI的值可能会有所不同。

因此,在使用NMI作为聚类有效性评价指标时,需要结合具体的应用场景和数据特点进行综合考虑。同时,也可以结合其他内部或外部有效性指标进行综合评估,以获得更全面、准确的聚类效果评价。

NMI作为聚类有效性评价指标的研究背景主要源于数据分析和挖掘的需求。随着数据量的快速增长和数据来源的多样

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天天酷科研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值