人工智能/机器学习基础知识——性能度量(Precision、Recall、F1、ROC、AUC)

性能度量

Precision、Recall、F1

准确率(查准率,查的准不准)、召回率(查全率,查的全不全)、F1

  • P-R曲线

    CSDN

    Precision-Recall

    • 绘制:(以二分类为例)按样本分类的置信度(概率)从大到小对样本进行排序,按此顺序逐个把样本作为正例进行预测,则每次可以得到当前的P、R值,以此绘制P-R曲线

    • 性质

      • 模型C的PR曲线完全被模型A包住,则说明模型A优于模型C

      • 模型A与模型B的PR曲线交叉,则根据以下方式判断

        • PR曲线与坐标轴围成面积大小(不易判断)

        • 平衡点(Break-Even Point,BEP):P=R时的坐标点。平衡点越大的模型可认为越优秀

      • P-R曲线对样本不均衡非常敏感

    在这里插入图片描述

  • F1

F 1 = 2 ∗ P ∗ R P + R F1 = \frac{2*P*R}{P+R} F1=P+R2PR

  • F β F_β Fβ

    F1的一般形式,能表达出对P/R的不同偏好

    • β = 1 β = 1 β=1时退化为标准的F1; β > 1 β > 1 β>1时R有更大影响; β < 1 β < 1 β<1时,P有更大影响

F β = ( 1 + β 2 ) ∗ P ∗ R ( β 2 ∗ P ) + R , β > 0 F_β = \frac{(1+β^2)*P*R}{(β^2*P)+R},β>0 Fβ=(β2P)+R(1+β2)PRβ>0

ROC & AUC

CSDN

Receiver Operating Characteristic & Area Under ROC Curve

T P R = T P T P + F N TPR = \frac{TP}{TP+FN} TPR=TP+FNTP

F P R = F P T N + F P FPR = \frac{FP}{TN+FP} FPR=TN+FPFP

  • 绘制:与P-R曲线类似先对样本进行排序,然后分别把分类阈值设置成样本的预测概率值,即依次把每个样例划分为正例

    • 注意:在上述绘制过程中, T P + F N TP+FN TP+FN F N + F P FN+FP FN+FP是不变的,改变的只有 T P TP TP F P FP FP,所以ROC曲线其实是折线图

    • TRICK:若当前样本本身是正例,则往上画 1 m + \frac{1}{m^+} m+1;反之,往右画 1 m − \frac{1}{m^-} m1

  • 性质

    • 若一个学习器的ROC曲线被另一个学习器的曲线完全包含,则可断言后者的性能优于前者

    • 若两曲线交叉,则根据与坐标轴围成的面积进行判断,即AUC(Area Under ROC Curve)

    • ROC曲线对样本不均衡不敏感

    在这里插入图片描述

  • 26
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值