通俗解释查准率和查全率的区别

最新推荐文章于 2024-06-07 21:26:16 发布

小米菲爱学习

最新推荐文章于 2024-06-07 21:26:16 发布

阅读量5.2k

点赞数 12

分类专栏：机器学习

本文链接：https://blog.csdn.net/miffy_love_zyx/article/details/109305730

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在这里插入图片描述
还记得自己在牛客刷一道题，发现一直傻傻分不清楚查准率（Precision）和查全率(Recall)。
在不同书上的翻译不同，也有人把Precision和Recall称为精确率和召回率。

那么这两者到底有什么区别呢？

通俗一点来说，现在我要从瓜农那里买瓜，假设瓜农卖300个瓜，其中150个是好瓜，150个是坏瓜。

我现在并不差钱，因此我决定从瓜农那里买下所有的好西瓜。作为顾客，我当然想吃又甜又新鲜的西瓜。由于不能一个一个剖开来尝——防止瓜农打我，我只能评以往的经验来挑出所有的好西瓜。
通过听声音，观察颜色，花纹…来猜我的西瓜是好是坏。这个猜的过程就是预测。

好了，我现在挑了半天，把我认为比较好的西瓜都找出来了——很可惜，我觉得这300个西瓜里只有50个好西瓜，并对瓜农表示了嫌弃（注意：这50个好西瓜可能并不是真正好西瓜的个数）

那么怎么衡量我挑西瓜的功底呢？（算法的好坏）

首先明确，在我的认知里，我挑出的这50个西瓜就是好西瓜，事实上50 = TP+FP，这个TP和FP是什么我们一会儿再讲。

我挑出的50个西瓜里，到底有多少是真正的好西瓜——这就是查准率。比如有30个，那么我的查准率就是3/5 = 0.6，看起来好像不赖嘛。（TP/TP+FP）

但是要注意，我在之前可是夸下海口，要挑出所有的好西瓜，所以光看我这50个里有多少好西瓜还不行！万一人家瓜农那里剩下的250个都是好瓜怎么办？？
这就要用到查全率了

当然，我还有另外一种途径来判断，那就是瓜农的150个瓜里，有多少个好瓜被我挑出来了，那么就是30/（30+120） = 30/150 = 0.2.(TP/TP +FN)

天啊，看起来好像有点丢人，这说明，我挑瓜的水平确实不怎么样，竟然有120个好西瓜都被我当成坏瓜了。

你可能已经注意到了我刚才反复用了几个奇怪的字母，T、P、F、N，这是什么东西呢？

P（Positive）表示我目前预测这个西瓜是好西瓜。
N（Negative）表示我目前预测这个西瓜是坏西瓜。

当然了，我的经验也不是次次都灵，所以我的预测中很有可能会出现偏差，因此还要引入两个符号——T和F。

T（True）表示我预测对了
F（False）表示我预测错了

细心的同学可能就发现了，那我有可能把好瓜猜成坏瓜，也有可能我猜的好瓜它就是好瓜… …总之，我的猜测过程有四种情况发生。

	P	N
T	TP	TN
F	FP	FN

很简单

TP表示我正确的预测了一个瓜为好瓜——即我猜这个西瓜它是好西瓜，实际上它就是好西瓜，我猜对了
TN表示我正确的预测了一个瓜为坏西瓜——我猜这个西瓜它是坏西瓜，实际上它就是坏西瓜，我也猜对了

你可能发现了，这两种情况表示我猜对了。

FP表示我错误的预测一个瓜为好瓜——我把坏人当好人了
FN表示我错误的预测一个瓜为坏西瓜——我把好人当坏人了

查准率（precision）：算法挑出来的西瓜中有多少比例是好西瓜；查全率（recall）：所有的好西瓜中有多少比例被算法跳了出来。

在这里插入图片描述
再来看看刚才的那个例子，其实在那个例子里TP = 30，表示我所预测的好瓜里，有30个被我预测正确了。
FP = 20，即我预测的50个好瓜里，有20个其实实际是坏西瓜，但是我却把它当成了好瓜。
FN = 120，即本来有150个好西瓜，我认为其中30个是好瓜，把他们挑走了，这相当于剩下的120本身是好瓜，我却误会了它们。

再来看看牛客这道题，现在可疑笔记其实就是我们想挑的“好瓜”，或许你要说可疑怎么是好瓜呢，无论如何，你就把他当成我们希望挑出的东西就行了。

我们拦截的笔记，一定是我们认为的“可疑笔记”，有多少是真的可疑笔记。这个问题其实就相当于，我们挑的瓜里，有多少是真的好瓜？

答案不言自明，应该用Precision(查准率)来衡量。

在这里插入图片描述
下次有时间，我们再看看精度(accuracy)和错误率（error rate）~
References:
[1] https://blog.csdn.net/qq_27871973/article/details/81065074
[2] 周志华.《机器学习》

小米菲爱学习

关注

12
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
通俗解释查准率和查全率的区别

还记得自己在牛客刷一道题，发现一直傻傻分不清楚查准率（Precision）和查全率(Recall)。在不同书上的翻译不同，也有人把Precision和Recall称为精确率和召回率。那么这两者到底有什么区别呢？通俗一点来说，现在我要从瓜农那里买瓜，假设瓜农卖300个瓜，其中150个是好瓜，150个是坏瓜。我现在并不差钱，因此我决定从瓜农那里买下所有的好西瓜。作为顾客，我当然想吃又甜又新鲜的西瓜。由于不能一个一个剖开来尝——防止瓜农打我，我只能评以往的经验来挑出所有的好西瓜。通过听声音，观.
复制链接

扫一扫

专栏目录