模型评估中的查准率、查全率、ROC曲线

本文介绍了二分类问题中查准率(P)和查全率(R)的概念,以及它们之间的矛盾关系,通过P-R曲线展示这种变化。同时,讨论了ROC曲线,其纵轴为真正例率(TPR),横轴为假正例率(FPR),并提出了AUC作为评价模型性能的指标。
摘要由CSDN通过智能技术生成

P-R曲线

对于二分类问题,可以将训练集的真实类别与机器学习预测的类别划分为真正例(true positive) 、假正例(false positive) 、真反倒(true negative) 、假反例(false negative) 四种情形,令TP 、FP 、TN 、FN 分别表示其对应的样例数,则显然有TP+FP+TN+FN=样例总数。分类结果的“混淆矩阵”如下:

查准率 P 与查全率 R 的定义如下:

查准率与查全率是一对矛盾的度量,一般来说,查准率高时,查全率较低;查全率高时,查准率偏低,常用查准率 P 作为纵轴,查全率 R 作为横轴的 P-R 曲线来表示两者的变化情况。

在进行机器学习比较时,可以用平衡点来比较,也可以使用P、R 的调和平均数 F1 来综合度量模型的效果,其公式如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值