理解查全率(precision)与查准率(recall)

本文解析了查全率与查准率在二分类任务中的概念,阐述了两者之间的矛盾关系,并介绍了F1度量和Fβ度量的计算方法,以及为何在理想情况下两者难以兼得。通过实例和西瓜书的解释,帮助理解这两个核心指标在评估模型性能时的作用。
摘要由CSDN通过智能技术生成

1. 概念解读

在一个二分类问题中,非对既是错

真实情况\预测情况positivenegative
TrueTPTN
FalseFPFN

Notice: 上面的图表是个反例,错误的原因是T\F的使用,T代表着预测正确,F代表着预测错误。

真实情况\预测情况positivenegative
TrueTPFN
FalseFPTN
  • 查全率
    precison = T P T P + F N \textrm{precison}=\frac{\mathrm{TP}}{TP+FN} precison=TP+FNTP
  • 查准率
    recall = T P T P + F P \textrm{recall}=\frac{\mathrm{TP}}{TP+FP} recall=TP+FPTP

查准率(Precision)就是你认为是对的样例中,到底有多少真是对的。
查全率(Recall)就是所有对的样例,你找出了多少,或者说你判断对了多少。

tip: 我在刚刚接触到这两个概念的时候总是傻傻分不清楚,这里记录一下我现在的看法。如上图数据,横着看表示数据集的正负分布,正集: TP ∪ FN \textrm{TP}\cup\textrm{FN} TPFN; 负集: FP ∪ TN \textrm{FP}\cup\textrm{TN} FPTN。首先查全率和查准率的分子都是 TP \textrm{TP} TP,表示所有猜对的正集,查准率针对的是预测集中认为是对的样例,分母是 T P + F P TP+FP TP+FP;查全率针对的是所有正确的样例,分母是 T P + F N TP+FN TP+FN

这里有一个问题: :查准率和查全率是一对矛盾的度量。一般来说查准率高时,查全率往往偏低;反之同理。 可是为什么就不能两个都高呢?
引用西瓜书上面的回答:

若希望将好瓜尽可能多的选出来,则可通过增加选瓜的数量来实现,如果将所有的西瓜都选上,那么所有的好瓜也必然都被选上了,但这样查准率就会较低,通常只有简单的问题,才会使查全率和查准率都很高。

2. F 1 F_1 F1度量

F 1 F_1 F1度量是基于查全率与查准率的调和平均(harmonic mean)。
定义为:
1 F 1 = 1 2 ( 1 P + 1 R ) \frac{1}{F_1}=\frac{1}{2}(\frac{1}{P}+\frac{1}{R}) F11=21(P1+R1)
F 1 = 2 × P × R P + R = 2 × T P 2 × T P + F P + F N F_1=\frac{2\times P\times R}{P+R}=\frac{2\times TP}{2\times TP+FP+FN} F1=P+R2×P×R=2×TP+FP+FN2×TP

3. F β F_\beta Fβ度量

F β F_\beta Fβ是加权调和平均,是F1度量的一般形式。
1 F β = 1 1 + β 2 ( 1 P + β 2 R ) \frac{1}{F_\beta}=\frac{1}{1+\beta^2}(\frac{1}{P}+\frac{\beta^2}{R}) Fβ1=1+β21(P1+Rβ2)

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

来日可期1314

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值