分类问题的评估方法--精确率(Precision)、召回率(Recall),F1,以及它们的关系

定义

  • 略。通过看书对于这两个指标自己是掌握了的,但是时间一长容易弄混淆,所以索性从例子的角度去理解这两个指标。
  • 对于精确率需要看预测值来确定分母,对于召回率样本确定分母。如果记忆的话就是 P r e c i s i o n < − − − > P r e d i c t Precision<--->Predict Precision<>Predict,两者都是以P开头,至于分子就是找出和分母一样的值的个数,这里具体说的是什么可以看下面的例子,然后自己想一想,应该有深切体会。
  • 另外,关于各种参考资料中写的正负样本在实际使用工程中都是自己定义的,在使用过程中需要根据自己的需要决定。

计算方式

给定的如下的样本值和相应的预测值,并假设T为正样本,N为负样本

sample  label: N、N、T、T、N、T、N、T、T、T、N
predict label: N、N、N、T、T、T、N、T、T、N、N

P r e c i s i o n = 4 5 Precision=\frac{4}{5} Precision=54,其中分母表示将5个样本预测为T,分子表示有4个预测对了;
R e c a l l = 4 6 Recall=\frac{4}{6} Recall=64,其中分母表示真实样本中有6个T,分子表示找到了4个T;

关系

这两个指标是没法同时变大的,就上面这个例子来说,

  • 如果将predict label全部预测为T,则召回率可以达到 100 % 100\% 100%,但是精确率却会变低;
  • 如果使用模型时对于样本的置信度高的离谱,才将其预测为T,则有很大的概率使得精确率变成 100 % 100\% 100%,而这种情况下召回率肯定会很低。

F1

顺利成章的,既然精确率和召回率作为单一的评估指标都不合适,所以 F 1 F1 F1这种同时考虑了两种指标的评估方法被提了出来,即两种指标的调和平均数。
F 1 = 2 1 P r e c i s i o n + 1 R e c a l l = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l F1=\frac{2}{ { \frac{1}{Precision} }+{ \frac{1}{Recall} } }=\frac{2\times{Precision}\times{Recall}}{Precision+Recall} F1=Precision1+Recall12=Precision+Recall2×Precision×Recall

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值