P-R曲线和ROC曲线

1 基本概念

1.1 混淆矩阵

混淆矩阵又称错误矩阵,指每个类别下,模型预测结果的类别和数量在一个矩阵中展示出来。

1.2 二元混淆矩阵

  • TP : True Positive 真阳
  • FN : False Negative 假阴
  • FP : False Positive 假阳
  • TN : True Negative 真阴
真实标签预测为正预测为负
真实为正TPFN
真实为负FPTN

1.2.1 召回 Recall

又称为 TPR (True Positive Rate)
或者 敏感度Sensitivity

通俗理解:真实为正的样本中识别为正的占比。

T P R = T P T P + F N TPR = \frac {TP} {TP+FN} TPR=TP+FNTP

1.2.2 精度Precision

又称为PPV (Positive Predictive Value)

通俗理解:识别为正的样本中真实为正的占比。

P P V = T P T P + F P PPV=\frac{TP}{TP+FP} PPV=TP+FPTP

1.2.3 准确率 Accuracy

通俗理解:所有样本中识别正确的比例。

a c c u r a c y = T P + T N T P + F N + F P + T N accuracy = \frac {TP+TN} {TP + FN + FP + TN} accuracy=TP+FN+FP+TNTP+TN

1.3 P-R曲线 (精度-召回曲线) (Precision-Recall curve)

直观理解:阈值降低,召回率升高时,精度下降情况。

  • 横坐标:召回 Recall
  • 纵坐标:精度 Precision

1.4 AP 平均精度 (Average-Precision)

P-R曲线围起来的面积

mAP

把每个类别的AP都单独拎出来,然后计算所有类别AP的平均值 。

1.5 受试者工作特征曲线 (Receiver Operating Curve)

直观理解:阈值降低,假阳升高时,真阳升高情况。

  • 横轴:假阳率 FPR F P R = F P F P + T N FPR = \frac{FP} {FP + TN} FPR=FP+TNFP
  • 纵轴:真阳率 TPR T P R = T P T P + F N TPR = \frac{TP} {TP + FN} TPR=TP+FNTP

P 为真实的正样本的数量;
N 为真实的负样本的数量。

1.6 AUC (Area Under Curve)

ROC曲线围住的面积。
AUC就是从所有正样本中随机选取一个,所有负样本中随机选取一个,然后用分类器预测,概率分别为p1、p0,p1>p0的概率就等于AUC。所以AUC反应的是分类器对样本的排序能力。根据这个解释,如果我们完全随机的对样本分类,那么 AUC应该接近0.5。另外,AUC对样本是否均衡并不敏感,这也是不均衡样本通常用AUC评价分类器性能的一个原因。

1.7 F1 score

F 1 = 2 ∗ P r e c i s i o n ∗ R e c a l l P r e c i s i o n + R e c a l l F1 = \frac{2*Precision*Recall} {Precision + Recall} F1=Precision+Recall2PrecisionRecall

参考资料

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张欣-男

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值