一文读懂多分类的评价指标（微平均、宏平均、加权平均）

最新推荐文章于 2025-03-26 16:37:04 发布

one-莫烦

最新推荐文章于 2025-03-26 16:37:04 发布

阅读量3.9k

点赞数 6

分类专栏：机器学习深度学习文章标签：分类算法人工智能机器学习

本文链接：https://blog.csdn.net/weixin_42127358/article/details/125412347

版权

21 篇文章

订阅专栏

16 篇文章

订阅专栏

这篇博客介绍了在多分类任务中常用的评价指标，包括宏平均、微平均和加权平均方法。宏平均对每个类别的指标取平均，平等对待所有类别；微平均则是对所有样本统一计算，更关注总体表现；加权平均根据类别样本数调整权重。选择合适的平均方式取决于是否重视稀有类别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

做CRF的时候会碰到多分类下的评价指标，记录一下
二分类的情况下可以参考二分类评价标准

三分类的混淆矩阵如下
在这里插入图片描述

该方法最简单，直接将不同类别的评估指标（Precision/ Recall/ F1-score）加起来求平均，给所有类别相同的权重。该方法能够平等看待每个类别，但是它的值会受稀有类别影响，会更加关注类别少的样本。

recall
recal = (recall(猫) +recall(鱼) +recall(鸡) )/3 = （0.66+0.2+0.66）/3
precision
precision= (precision(猫) +precision(鱼) +precision(鸡) )/3 = （0.3076+0.66+0.66）/3

该方法把每个类别的TP, FP, FN先相加之后，在根据二分类的公式进行计算。（分子是分子之和分母是分母之和）

Micro-average下，多分类的accuracy，recall和precision会相同，这不是个例 。