sklearn中 F1-micro 与 F1-macro区别

最新推荐文章于 2024-05-27 17:26:56 发布

黑人月

最新推荐文章于 2024-05-27 17:26:56 发布

阅读量659

点赞数 3

分类专栏： # 毕业文章标签： python 大数据人工智能机器学习

本文链接：https://blog.csdn.net/a523900582/article/details/118103997

版权

毕业专栏收录该内容

3 篇文章 0 订阅

订阅专栏

sklearn中 F1-micro 与 F1-macro区别和计算原理

最近在使用sklearn做分类时候，用到metrics中的评价函数，其中有一个非常重要的评价函数是F1值，（关于这个值的原理自行google或者百度）

   在sklearn中的计算F1的函数为 f1_score ，其中有一个参数average用来控制F1的计算方式，今天我们就说说当参数取micro和macro时候的区别

1、F1公式描述:

F1-score: 2*(P*R)/(P+R)

            准确率（P）： TP/ (TP+FP) 
            召回率(R)： TP(TP + FN)

对于数据测试结果有下面4种情况：
真阳性（TP）: 预测为正，实际也为正
假阳性（FP）: 预测为正，实际为负
假阴性（FN）: 预测为负，实际为正
真阴性（TN）: 预测为负，实际也为负

2、 f1_score中关于参数average的用法描述:

'micro':Calculate metrics globally by counting the total true positives, false negatives and false positives.

'micro':通过先计算总体的TP，FN和FP的数量，再计算F1

'macro':Calculate metrics for each label, and find their unweighted mean. This does not take label imbalance into account.

'macro':分布计算每个类别的F1，然后做平均（各类别F1的权重相同）

3、初步理解

通过参数用法描述，想必大家从字面层次也能理解他是什么意思，micro就是先计算所有的TP，FN , FP的个数后，然后再利上文提到公式计算出F1

macro其实就是先计算出每个类别的F1值，然后去平均，比如下面多分类问题，总共有1,2,3,4这4个类别，我们可以先算出1的F1，2的F1，3的F1，4的F1,然后再取平均（F1+F2+F3+4）/4

        y_true = [1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4]
	    y_pred = [1, 1, 1, 0, 0, 2, 2, 3, 3, 3, 4, 3, 4, 3]

4、进一步理解

我们还是以上面的例子为例说明sklearn中是如何计算micro 和 macro的：

micro计算原理

首先计算总TP值，这个很好就算，就是数一数上面有多少个类别被正确分类，比如1这个类别有3个分正确，2有2个，3有2个，4有1个，那TP=3+2+2+1=8

其次计算总FP值，简单的说就是不属于某一个类别的元数被分到这个类别的数量，比如上面不属于4类的元素被分到4的有1个

如果还比较迷糊，我们在计算时候可以把4保留，其他全改成0，就可以更加清楚地看出4类别下面的FP数量了，其实这个原理就是 One-vs-All (OvA)，把4看成正类，其他看出负类
在这里插入图片描述

我这么理解的
TP看真实和预测对上的个数
FP看预测的集合，对不上的那个类的个数
TF看真实的集合，对不上的那个类的个数

同理我们可以再计算FN的数量
在这里插入图片描述

所以micro的精确度P 为 TP/(TP+FP)=8/(8+4)=0.666 召回率R TP/(TP+FN)=8/(8+6)=0.571 所以F1-micro的值为：0.6153

可以用sklearn来核对,把average设置成micro

y_true = [1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4]
y_pred = [1, 1, 1, 0, 0, 2, 2, 3, 3, 3, 4, 3, 4, 3]
print(f1_score(y_true,y_pred,labels=[1,2,3,4],average='micro'))
#>>> 0.61538461538

macro计算原理

macro先要计算每一个类的F1，有了上面那个表，计算各个类的F1就很容易了，比如1类，它的精确率P=3/(3+0)=1 召回率R=3/(3+2)=0.6 F1=2*(1*0.5)/1.5=0.75

可以sklearn，来计算核对,把average设置成macro

#average=None,取出每一类的P,R,F1值
p_class, r_class, f_class, support_micro=precision_recall_fscore_support(y_true=y_true, y_pred=y_pred, labels=[1, 2, 3, 4], average=None)
print('各类单独F1:',f_class)
print('各类F1取平均：',f_class.mean())
print(f1_score(y_true,y_pred,labels=[1,2,3,4],average='macro'))
#>>>各类单独F1: [ 0.75        0.66666667  0.5         0.5       ]
#>>>各类F1取平均： 0.604166666667
#>>>0.604166666667

本文章引用自https://www.cnblogs.com/techengin/p/8962024.html并添加了一点个人理解，仅用于来拿复习

黑人月

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
sklearn中 F1-micro 与 F1-macro区别

sklearn中 F1-micro 与 F1-macro区别和计算原理最近在使用sklearn做分类时候，用到metrics中的评价函数，其中有一个非常重要的评价函数是F1值，（关于这个值的原理自行google或者百度）在sklearn中的计算F1的函数为 f1_score ，其中有一个参数average用来控制F1的计算方式，今天我们就说说当参数取micro和macro时候的区别1、F1公式描述:F1-score: 2*(P*R)/(P+R) 准确率（P）：
复制链接

扫一扫