精确率越高可能导致召回率越低的原因

为什么说可能,因为如果模型效果特别好则精确率和召回率都会很高

精确率 = TP/(TP+FP) 表示预测中实际为正的样本占所有预测样本比例
召回率 = TP/(TP+FN) 表示预测中实际为正的样本占所有正样本的比例

当精确率越高时,意味着模型在预测正例时更加准确,减少了误判的可能性。而召回率衡量了模型是否能够捕捉到所有的正例,即避免漏掉真正的正例。由于精确率和召回率的计算中分母不同,它们之间存在一种权衡关系:

  • 如果模型倾向于更加谨慎,提高了预测为正例的准确性(增加精确率),则可能会漏掉一些真正的正例,导致召回率降低。
  • 相反,如果模型更加倾向于将样本标记为正例,以确保捕捉到更多的真正例(增加召回率),则可能会增加假正例,导致精确率降低。

这里举个例子:比如做文本相似度匹配:“用一个句子去查找数据库中与其相似的文章”,假如数据库中与其相似的有100篇文章。在实现过程中可能涉及到 “距离” ,如果句子与文章的距离小于0.1,将其定义为相似(这里假如0.1非常小,表示句子与文章非常相似),那么模型查找出来10篇文章,其中9篇都与这个句子非常相似,那么 精确率 =9/(9+1) = 0.9 就非常高,因为设置的距离非常苛刻,可以保证预测出来的大部分文章都与该句子相似,但 召回率=9/100 = 0.09, 这个时候如果设置距离为 0.05,模型查找出来5篇,但这5篇全是与该句子相似的文章,精确率为1,但召回率为5/100 = 0.05更低。如果要提高召回率,那么可以将距离设置为0.2,距离放宽之后模型会查找出来更多符合条件的的文章比如50篇,但只有40篇是真正相似的,精确率就为40/50 = 0.8,但是召回率为40/100 = 0.4,相比之前就提高了。所以精确率越高可能导致召回率越低,这时就要权衡 距离 这个阈值的设置来权衡精确率和召回率,或者优化模型提高其性能。

在实际问题中,具体选择更重视精确率还是召回率取决于问题的特性。例如,在医学诊断中,可能更加关注精确率,因为确保诊断结果的准确性很重要;而在垃圾邮件检测中,可能更加关注召回率,以确保尽可能多地捕捉到所有的垃圾邮件。

  • 21
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天堂不能没有你

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值