查准率和查全率_机器学习之查准率与查全率

    注意:查准率不是准确率!

    我们先明了的解释下相关概念:

    准确率:所有样本中预测正确的比例,分母是所有样本数。

    查准率:在所预测类别中,预测正确的比例,分母是预测类别的样本数。

    查全率:在真实类别中,预测正确的比例,分母是真实类别的样本数。

    下面举个例子来直观看下:

05cccb787b846a6b951dfb72e9d12440.png

    例子中:

        0类查准率=8/(8+4),0类查全率=8/(8+2)

        1类查准率=6/(2+6),1类查全率=6/(4+6)

    我们以0类来说,其查准率就是预测为0的8+4个样本中确实是0的8个样本的比例;其查全率就是真实为0的8+2个样本中预测正确的8个样本的比例。

    好了,查准率与查全率已经解释很清楚了,如果还是有点迷惑的话就看看上面的例子琢磨一下就明白了。

    然后我们再说下查准率与查全率的关系和意义。

    通常来说查准率与查全率是矛盾的,比如我们要检测出所有的1类样本,那么我们把预测结果都设置为1,则查全率就是100%,但查准率就很低了,因而如何在模型训练中同时获得较好的查准率和查全率就是一个很有意思的问题了,这就是我们经常说的查准率-查全率曲线,简称P-R曲线。

8c4a348188df5412d3b96e40d750b390.png

    上述曲线的计算过程是这样的。首先根据模型的预测结果对样本进行排序,然后按照排序顺序依次把样本判定为正例进行预测,比如预测正例数从0到所有,这样每次都能计算一个查准率与查全率,然后就可以画出当前的P-R曲线,多个模型就会有多个曲线。我们认为外部曲线比内部曲线性能更好,这是因为外部曲线的查准率和查全率比内部的能同时更大,而对于有交叉的曲线则可以比较其F1分数,越高说明越好;通常根据不同项目需求可以使用其一般形式Fβ进行权重设置。

    好了,今天主要说了下查准率、查全率、P-R曲线,这都是对模型的性能评估很有用的指标,大家可以多理解一下,会很有帮助的O(∩_∩)O

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值