多分类中accuary与micro F1-score的恒等性

最新推荐文章于 2023-08-21 22:55:53 发布

da_kao_la

最新推荐文章于 2023-08-21 22:55:53 发布

阅读量5.8k

点赞数 18

分类专栏： Machine Learning 文章标签：机器学习 micro F1 score accuracy 理论推导

本文链接：https://blog.csdn.net/da_kao_la/article/details/104616016

版权

Machine Learning 专栏收录该内容

16 篇文章

订阅专栏

本文详细探讨了在多分类问题中，micro F1分数与准确率（accuracy）为何数值相等。通过数学证明，解释了两者在计算上的等价性，即在多分类场景下，当采用micro平均方式时，F1分数实际上等同于模型的整体准确率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

发现在多分类问题（这里『多分类』是相对于『二分类』而言的，指的是类别数超过2的分类问题）中，用sklearn的metrics.accuracy_score(y_true, y_pred)和float(metrics.f1_score(y_true, y_pred, average="micro"))计算出来的数值永远是一样的，在stackoverflow中搜索这个问题Is F1 micro the same as Accuracy?
也搜到micro F1 score与accuracy数值是相等的，遂证明如下：
定义TP/FP/FN为多分类问题各类的tp/fp/fn之和，三者之间的关系有如下引理（其中ALL是总样本数）。
引理：

FP = FN = F
F + TP = ALL

引理的证明：FP与FN恒等性的简单证明：
考虑多分类问题的混淆矩阵，FP和FN的值都是混淆矩阵所有非对角线的值求和，只不过FP计算时是先对列求和再对行求和，FN计算时是先对行求和再对列求和。由于FP与FN恒等，故可以统一记作F. 而TP是混淆矩阵的对角线和。引理证毕。
下面计算micro PrecisionP, micro RecallR, micro F1 score F1:

P = TP / (TP + FP)

R = TP / (TP + FN)

F1 = 2 * P * R / (P + R) 
= 2 * TP / (2 * TP + FP + FN) 
= 2 * TP / (2 * TP + 2 * F) 
= TP / (TP + F) 
= TP / ALL
= acc

其中acc是多分类的accuracy. 证毕。