手推多分类precision(精确率)、recall(召回率)、F1分数

芒果不茫QAQ

已于 2023-08-23 10:52:29 修改

阅读量4.4k

点赞数 6

分类专栏：深度学习文章标签：分类算法

于 2022-10-07 20:45:44 首次发布

本文链接：https://blog.csdn.net/qq_41496421/article/details/127196850

版权

深度学习专栏收录该内容

9 篇文章 5 订阅

订阅专栏

文章目录

样例
混淆矩阵
precision、recall、F1分数介绍
多分类 macro、micro、weighted

代码实现可参考：NER实体级别与token级别指标代码实现——precision(精确率)、recall(召回率)、F1分数

样例

本文使用以下样例来计算混淆矩阵、precision、recall和F1分数

真实值：[0, 1, 0, 0, 1, 2]
预测值：[0, 2, 1, 0, 0, 2]

混淆矩阵

混淆矩阵将分类结果进行了四种情况的区分，如下图

在这里插入图片描述

首先，不管是二分类还是多分类问题，混淆矩阵是针对其中某一类别的；如对苹果、香蕉、葡萄进行分类，建立苹果类的混淆矩阵时，苹果是正类(positive)，其他类即香蕉、葡萄都是负类(negative)。

TP、FN、FP、TN的第一个字母全称为True或False，代表预测值与真实值是否相同，第二个字母全称为Positive或negative，代表预测值是正类还是负类。如：

TP：预测为苹果(P)，实际也为苹果，预测正确(T)
FN：预测不是苹果(N)，实际是苹果，预测错误(F)
FP：预测为苹果(P)，实际不是苹果，预测错误(F)
TN：预测不是苹果(N)，实际不是苹果，预测正确(T)

得到预测结果后，对每个类别的这四种情况进行计数，则得到了混淆矩阵。

在样例中类别0的混淆矩阵为

类别0	Positive	Negative
Positive	2	1
Negative	1	2

在样例中类别1的混淆矩阵为

类别0	Positive	Negative
Positive	0	2
Negative	1	3

在样例中类别2的混淆矩阵为

类别0	Positive	Negative
Positive	1	0
Negative	1	4

多分类合到一起的混淆矩阵为

类别	0	1	2
0	2	1	0
1	1	0	1
2	0	0	1

代码实现

from sklearn.metrics import confusion_matrix

y_true = [0, 1, 0, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 2]
print('confusion_matrix:\n', confusion_matrix(y_true, y_pred))

在这里插入图片描述

precision、recall、F1分数介绍

$\frac{类别n预测正确的个数}{预测值中类别n的个数}=\frac{TP}{TP+FP}$
$\frac{类别n预测正确的个数}{真实值中类别n的个数}=\frac{TP}{TP+FN}$
$2*\frac{precision * recall}{precision + recall}$

样例中每个类别的precision、recall、F1分数为

类别/评价指标	precision	recall	F1-score
类别0	2/3	2/3	2/3
类别1	0	0	0
类别2	1/2	1	2/3

多分类 macro、micro、weighted

在多分类任务中，每一个类别都有一组precision、recall、F1分数，如何平衡各类别的分数得到全局的评价指标呢？有三种方法macro、micro、weighted。

macro宏观：单个类别计算完之后取平均，不考虑类别不平衡问题；

macro precision： $(\frac{2}{3} + 0 + \frac{1}{2}) / 3 = \frac{7}{18}$
macro recall： $(\frac{2}{3} + 0 + 1) / 3 = \frac{5}{9}$
macro F1： $(\frac{2}{3} + 0 + \frac{2}{3}) / 3 = \frac{4}{9}$

micro微观：所有样本做一个整体，分母为所有样本个数，

micro precision： $\frac{3}{6} = 0.5$
解释：3为各个类别预测正确的个数之和，6为各个类别预测值的总个数
micro recall： $\frac{3}{6} = 0.5$
解释：3为各个类别预测正确的个数之和，6为各个类别真实值的总个数，与精确率相等
micro F1： $*\frac{0.5 * 0.5}{0.5 + 0.5} = 0.5$
解释：上面的precision和recall求的F1分数

weighted：按真实值中各类别个数取权重

weighted precision： $\frac{2}{3} * \frac{1}{2} + 0 * \frac{1}{3} + \frac{1}{2} * \frac{1}{6} = \frac{5}{12}$
解释：真实值中有3个0、2个1、1个2，所占比例分别为1/2、1/3、1/6
weighted recall： $\frac{2}{3} * \frac{1}{2} + 0 * \frac{1}{3} + 1 * \frac{1}{6} = \frac{1}{2}$
weighted F1： $\frac{2}{3} * \frac{1}{2} + 0 * \frac{1}{3} + \frac{2}{3} * \frac{1}{6} = \frac{4}{9}$

代码实现

from sklearn.metrics import f1_score, recall_score, precision_score

y_true = [0, 1, 0, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 2]

average = 'macro'
print('\nmacro precision:',precision_score(y_true, y_pred, average=average), 
      '\nmacro recall:', recall_score(y_true, y_pred, average=average), 
      '\nmacro f1_score:', f1_score(y_true, y_pred, average=average))

average = 'micro'
print('\nmicro precision:',precision_score(y_true, y_pred, average=average), 
      '\nmicro recall:', recall_score(y_true, y_pred, average=average), 
      '\nmicro f1_score:', f1_score(y_true, y_pred, average=average))

average = 'weighted'
print('\nweighted precision:',precision_score(y_true, y_pred, average=average), 
      '\nweighted recall:', recall_score(y_true, y_pred, average=average), 
      '\nweighted f1_score:', f1_score(y_true, y_pred, average=average))