总是记不住的精度，回召率和F1 Score

快叫我小白

已于 2022-08-24 22:03:22 修改

阅读量571

点赞数 3

文章标签：机器学习 python 人工智能

于 2022-08-24 21:56:57 首次发布

本文链接：https://blog.csdn.net/qq_42935201/article/details/126509556

版权

撰写本文的契机

在学机器学习的时候，开头第一章的内容就是Precision，ReCall和F1 Score，第一次看的时候感觉概念挺简单的，但是每每在文献或者技术博客上看到相关内容的时候，总是记不住，总是会被TP、NP，TF和NF这样的术语弄晕。

今天恰巧找到机会重新理解了一遍相关的概念，写下这个博客，记录此刻我对这些概念的理解（人话翻译），以便今后快速复习。

以下内容参考自李航老师的 《统计学习与方法》 和这篇技术博客

正文

概念背景

机器学习的两大任务，一个分类，一个回归。接下来要介绍的概念跟回归的关系不大，它们主要用于描述一个模型分类的效果。“它们”主要是：

Precision（精度）
ReCall（回召率）
F1 Score

我们这三个概念主要针对二分类。例如，现在我们手上有个模型，它只认识猫，理想情况下，你给它输入一张不是猫的照片，例如狗，它给你输出Negative；如果你给它输入猫的照片，它会输出Positive。

但是有朋友要举手了，说不对呀，即使是多分类的任务，也能用上文那几个参数去描述。原来，上述那三个参数是针对每个类别进行描述的。这是什么意思呢？

例如，我们手头拿着一个多分类器，它可以识别苹果（0）、香蕉（1）、雪梨（2）、西瓜（3）和其它（4），括号里面的数字是这些类别的标签。

在研究模型对“苹果”这一个类别的表现时，我们认为，所有的类别可以分为苹果和非苹果。例如，我们给模型输入一张雪梨的图片，模型正确地输出了“2”，但是对于当前“苹果”这个类别来说，它就是非苹果，所以我们仍然认为它的输出结果为Negative，只有模型输出的数字为“0”，我们才认为当前模型的输出为Positive。

理解了上一段话的意思以后，我们不难知道，对于多分类任务中，每个类别都有一套对应的Precision、Recall和F1 Score。

三个概念

数据背景：想象我们现在有许多张图片，其中有许多张猫的照片，另外的照片都不是猫。猫的照片我们称之为正样本，非猫的照片我们称之为负样本。

TP FN TN FP

现在我手里拿着一个只认识猫的分类器，理想情况下，我输入猫的照片，它输出Positive，否则Negative。

我输入了一张猫的图片，此时分类器里所应当地输出了Positive，那么，这张图片是猫，是正样本，并且预测正确，那么这个样本的英文名是： True Positive，简称TP。

我现在又输入了一张猫的图片，但是分类器输出了Negative，毕竟我们的分类器肯定不是十全十美的，这正是标题这几个概念存在的意义。此时，我输入的是正样本，并且预测错误，那么这个样本的英文名为：False Negative，简称FN。

类似地，我输入了一张不是猫的图片，分类器给出了Negative，这个样本为负样本并且预测正确，英文名为True Negative，简称TN；我又输入了一张不是猫的照片，但是分类器给出Positive，这个样本是负样本并且预测错误，英文名为False Positive，简称FP。

呼，仔细读下来确实很拗口。我们输入的任何一张图片必定会被归类为上述四类中的其中一类。也就是说，如果我们手上有N张图片，那么

TP+FN+TN+FP=N。

三个概念的人话翻译

终于到我们的三个主角了。如果你已经记住了上一个小节的描述，那么我们的主题很快就能接受啦。如果还没理解，还请再花两分钟认真理解一下上节内容。

想象现在你的手上还是有好多张图片，猫和非猫，而且我们的分类器还是只认识猫。并且你把这些图片一股脑地扔进了分类器，得到了每张图片对应的输出，也就是一堆Negative和Positive，并且你已经把每一张图片都分成上一节里提到的四个类别。

Precision

我现在问你，你手上这堆Positive，正确的比例是多少？ 我可是顺利从小学毕业，那当然是Positive里，预测正确的正样本个数比上预测为正样本的个数。那前者等于多少？哦，TP。后者呢？哦，TP+FP。二者一除，我们得到了上述问题的答案，那么恭喜你，你成功计算出了Precision。

Recall

我再问你，你手上这堆猫的图片，预测正确的比例是多少？ 呜，这个问题也很简单，但是好像要饶个圈圈。小学的知识告诉我，公式是预测正确的猫的个数比上所有猫的图片的个数。那预测正确的猫的个数是多少？猫是正样本，那就是TP！那我手里有几张猫的照片？我想，应该是预测正确的猫的个数加上预测错误的猫的个数，前者是TP，那后者重新翻译一下，应该是样本是正样本，并且预测错误，FN！那猫的个数应该就是TP+FN。终于，你计算出了Recall。