macro-F1（宏平均F1）和micro-F1（微平均F1）

君的名字

于 2025-03-26 16:37:04 发布

阅读量796

点赞数 18

分类专栏：【机器学习】文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/chichoxian/article/details/146534514

版权

19 篇文章

订阅专栏

在机器学习中，**macro-F1（宏平均F1）和micro-F1（微平均F1）**是两种评估多分类任务性能的指标。它们的核心区别在于对各类别的权重分配方式不同，适用于不同的场景需求。

核心思想：平等看待每个类别，计算每个类别的F1值后取算术平均。
计算步骤：
1. 对每个类别单独计算F1值（基于该类的TP、FP、FN）。
2. 将所有类别的F1值相加，除以类别总数。
公式：

$\text{Macro-F1} = \frac{1}{N} \sum_{i=1}^{N} \text{F1}_i$

（其中，(N)为类别数，(\text{F1}_i)为第(i)类的F1值）

$\text{Micro-F1} = \frac{2 \cdot \text{Global-P} \cdot \text{Global-R}}{\text{Global-P} + \text{Global-R}}$

（其中，Global-P和Global-R是全局的精确率和召回率）

假设一个三分类任务（A、B、C），混淆矩阵如下：

真实\预测	A	B	C
A	90	5	5
B	2	85	13
C	1	10	89

Macro-F1：
- 计算每类的F1：
  - A类：Precision=90/(90+2+1)=0.97, Recall=90/(90+5+5)=0.90 → F1=0.93
  - B类：Precision=85/(5+85+10)=0.85, Recall=85/(2+85+13)=0.85 → F1=0.85
  - C类：Precision=89/(5+13+89)=0.83, Recall=89/(1+10+89)=0.89 → F1=0.86
- Macro-F1 = (0.93 + 0.85 + 0.86)/3 ≈ 0.88
Micro-F1：
- 全局TP = 90+85+89 = 264
- 全局FP = (5+2+1) + (5+13+10) + (5+13+10) = 需重新计算（实际为各列总和减TP）
- 全局Precision = 264 / (264 + FP)
- 全局Recall = 264 / (264 + FN)
- 最终结果偏向样本数多的类别（例如A类样本更多时）。