机器学习学习笔记（4）——macro-F1与micro-F1

最新推荐文章于 2024-05-27 17:26:56 发布

野指针小李

最新推荐文章于 2024-05-27 17:26:56 发布

阅读量3.3k

点赞数 3

分类专栏：机器学习文章标签：机器学习 macro-F1 micro-F1 F1 score 性能评价

本文链接：https://blog.csdn.net/qq_35357274/article/details/111987338

版权

6 篇文章 11 订阅

订阅专栏

本文以我自己的实验数据来作为样例说明何为macro F1与micro F1

对了宝贝儿们，卑微小李的公众号【野指针小李】已开通，期待与你一起探讨学术哟~摸摸大！

1 前置知识

关于F1 score的内容如果还不清楚的朋友，可以参考我的上一篇博客：《机器学习学习笔记（1）——错误率、精度、准确率、召回率、F1度量》

这里就只简单的提一下核心的混淆矩阵与公式：

混淆矩阵
F1 score的公式：

$\frac{2 P R}{P + R}$

其中： $P$ 是查准率（precision）， $R$ 是查全率（recall），相关公式如下：

$\frac{TP}{TP+FP}$

$\frac{TP}{TP+FN}$

可能许多刚看到这里的同学会有疑问：macro-F1，micro-F1与F1的区别何在呢？他们的区别在于macro-F1与micro-F1是针对多类别的任务，而F1只针对单个类的任务。

以我实验为例：

实验数据
这是一个情感分析的任务，我做的是三分类，i.e. 情感值给分为positive，neural，negative。

大家看到这里估计有头绪了，就是说每一个类别都要计算相应的TP，FN，FP值。我们以positive来举例，就是说：

其他两个类别同理。

我们由此可以构建出三个混淆矩阵（由于F1 score中不需要TN，所以我没有统计）：

positive的混淆矩阵

neural的混淆矩阵
negative的混淆矩阵

如果我们只考虑某一个类别（比如positive），那么直接将positive这个类别中的数据代入到F1 score的公式计算即可；但是如果我们要考虑这三个类别的F1 score，那么就要用到macro-F1或者micro-F1。

这里先说两者的使用场景，再说计算方式：

micro-F1：在计算公式中考虑到了每个类别的数量，所以适用于数据分布不平衡的情况；但同时因为考虑到数据的数量，所以在数据极度不平衡的情况下，数量较多数量的类会较大的影响到F1的值；
macro-F1：没有考虑到数据的数量，所以会平等的看待每一类（因为每一类的precision和recall都在0-1之间），会相对受高precision和高recall类的影响较大；

micro-F1：将每个类别的TP、FP、FN分别对应求和，计算总的P和R，最后求得的F1值时micro-F1。以上面的实验栗子来看：
$\\ FP=1188 + 281 + 1656=3125 \\ FN=1025+1370 + 730 = 3125 \\ P=\frac{3299}{3299 + 3125}=0.5135 \\ R = \frac{3299}{3299 + 3125} = 0.5135 \\ microF1=\frac{2×0.5135×0.5135}{0.5135+0.5135}=0.5135$
macro-F1：分别计算每个类别的F1，最后求算数平均数得到的值就是macro-F1。以上面的实验栗子来看：
$P(negative)=\frac{1502}{1502+1188}= 0.5584 \\ R(negative)=\frac{1502}{1502+1025}= 0.5944 \\ F1(negative)=\frac{2×0.5584×0.5944}{0.5584+0.5944}=0.5758 \\ ... \\ F1(positive) = 0.5855 \\ ... \\ F1(neural) = 0.1195 \\ macroF1 = \frac{1}{3} × (0.5758+0.5855+0.1195)=0.4269$