通俗解释查准率和查全率的区别

在这里插入图片描述
还记得自己在牛客刷一道题,发现一直傻傻分不清楚查准率(Precision)和查全率(Recall)。
在不同书上的翻译不同,也有人把Precision和Recall称为精确率和召回率。

那么这两者到底有什么区别呢?

通俗一点来说,现在我要从瓜农那里买瓜,假设瓜农卖300个瓜,其中150个是好瓜,150个是坏瓜。

我现在并不差钱,因此我决定从瓜农那里买下所有的好西瓜。 作为顾客,我当然想吃又甜又新鲜的西瓜。由于不能一个一个剖开来尝——防止瓜农打我,我只能评以往的经验来挑出所有的好西瓜。
通过听声音,观察颜色,花纹…来猜我的西瓜是好是坏。这个猜的过程就是预测。

好了,我现在挑了半天,把我认为比较好的西瓜都找出来了——很可惜,我觉得这300个西瓜里只有50个好西瓜,并对瓜农表示了嫌弃(注意:这50个好西瓜可能并不是真正好西瓜的个数)

那么怎么衡量我挑西瓜的功底呢?(算法的好坏)

首先明确,在我的认知里,我挑出的这50个西瓜就是好西瓜,事实上50 = TP+FP,这个TP和FP是什么我们一会儿再讲。

我挑出的50个西瓜里,到底有多少是真正的好西瓜——这就是查准率。比如有30个,那么我的查准率就是3/5 = 0.6,看起来好像不赖嘛。(TP/TP+FP)

但是要注意,我在之前可是夸下海口,要挑出所有的好西瓜,所以光看我这50个里有多少好西瓜还不行!万一人家瓜农那里剩下的250个都是好瓜怎么办??
这就要用到查全率了

当然,我还有 另外一种途径来判断,那就是瓜农的150个瓜里,有多少个好瓜被我挑出来了,那么就是30/(30+120) = 30/150 = 0.2.(TP/TP +FN)

天啊,看起来好像有点丢人,这说明,我挑瓜的水平确实不怎么样,竟然有120个好西瓜都被我当成坏瓜了。

你可能已经注意到了我刚才反复用了几个奇怪的字母,T、P、F、N,这是什么东西呢?

P(Positive)表示我目前预测这个西瓜是好西瓜。
N(Negative)表示我目前预测这个西瓜是坏西瓜。

当然了,我的经验也不是次次都灵,所以我的预测中很有可能会出现偏差,因此还要引入两个符号——T和F。

T(True)表示我预测对了
F(False)表示我预测错了

细心的同学可能就发现了,那我有可能把好瓜猜成坏瓜,也有可能我猜的好瓜它就是好瓜… …总之,我的猜测过程有四种情况发生。

PN
TTPTN
FFPFN

很简单

TP表示我正确的预测了一个瓜为好瓜——即我猜这个西瓜它是好西瓜,实际上它就是好西瓜,我猜对了
TN表示我正确的预测了一个瓜为坏西瓜——我猜这个西瓜它是坏西瓜,实际上它就是坏西瓜,我也猜对了

你可能发现了,这两种情况表示我猜对了。

FP表示我错误的预测一个瓜为好瓜——我把坏人当好人了
FN表示我错误的预测一个瓜为坏西瓜——我把好人当坏人了

查准率(precision):算法挑出来的西瓜中有多少比例是好西瓜; 查全率(recall):所有的好西瓜中有多少比例被算法跳了出来。

在这里插入图片描述
再来看看刚才的那个例子,其实在那个例子里TP = 30,表示我所预测的好瓜里,有30个被我预测正确了。
FP = 20,即我预测的50个好瓜里,有20个其实实际是坏西瓜,但是我却把它当成了好瓜。
FN = 120,即本来有150个好西瓜,我认为其中30个是好瓜,把他们挑走了,这相当于剩下的120本身是好瓜,我却误会了它们。

再来看看牛客这道题,现在可疑笔记其实就是我们想挑的“好瓜”,或许你要说可疑怎么是好瓜呢,无论如何,你就把他当成我们希望挑出的东西就行了。

我们拦截的笔记,一定是我们认为的“可疑笔记”,有多少是真的可疑笔记。这个问题其实就相当于,我们挑的瓜里,有多少是真的好瓜?

答案不言自明,应该用Precision(查准率)来衡量。

在这里插入图片描述
下次有时间,我们再看看精度(accuracy)和错误率(error rate)~
References:
[1] https://blog.csdn.net/qq_27871973/article/details/81065074
[2] 周志华.《机器学习》

  • 12
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值