机器学习笔记--模型评估之三:ROC曲线与P-R曲线对比有什么特点?

P-R曲线与ROC曲线是评估分类模型性能的重要工具。P-R曲线关注预测精度与召回率,适合于正负样本分布不平衡的情况;ROC曲线则更稳定,不受样本分布影响。在样本极度不平衡时,ROC曲线更能反映模型本质性能,常用于排序、推荐和广告等领域。两者选择取决于具体应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

 P-R曲线

        即Precision-Recall曲线

        P=TP/(TP+FP) ,P是代表预测为真且真实为真的数据占预测为真数据的比例。

        R=TP/(TP+FN),R是代表预测为真且真实为真的数据占真实为真数据的比例

ROC曲线

即Receiver Operating Characteristic Curve曲线,横坐标为假阳率(False Positive Rate,FPR),纵坐标为真阳率(True Positive Rate,TPR)

P-R与ROC对比

相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化

这个特点让ROC曲线能够尽量降低不同测试集带来的干扰,更加客观的衡量模型本身的性能。

比如在很多实际问题中,正负样本数量往往恨不均衡,比如计算广告领域经常涉及转化率模型,正样本数量往往是负样本数量的1/1000甚至1/10000,若选择不同的测试集,P-R前变化就会非常大,而ROC曲线则能更加稳定的反映模型本身的好坏。所以ROC曲线的使用场景更多,被广泛用于排序、推荐、广告等领域。

但是需要注意的是,选择P-R还是选择ROC是因实际问题而异。如果研究者希望更多的看模型在特定数据集上的表现,P-R曲线则能够更直观的反映其性能。

ROC曲线的由来:

ROC曲线最早是运用在军事上,后来逐渐运用到医学领域。相传在第二次世界大战期间,雷达兵的任务之一就是死死地盯住雷达显示器,观察是否有敌机来袭。理论上讲,只要有敌机来袭,雷达屏幕上就会出现相应的信号,但是实际上,有时如果有飞鸟出现在雷达扫描区域时,雷达屏幕上有时也会出现信号。这种情况令雷达兵烦恼不已:如果过于谨慎,凡是有信号就确定为敌机来袭,显然会增加误报风险;如果过于大胆,凡是信号都认为飞鸟,又会增加漏报的风险。每个雷达兵都竭尽所能地研究飞鸟信号和飞机信号之间的区别,以便增加预报的准确性。但问题在于,每个雷达兵都有自己的判别标准,有的雷达兵比较谨慎,容易出现误报;有的雷达兵则比较胆大,容易出现漏报。

为了研究每个雷达兵预报的准确性,雷达兵的管理者汇总了所有雷达兵的预报特点,特别是他们漏报和误报的概率,并将这些概率画到一个二维坐标里面。这个二维坐标的纵坐标为敏感性,即在所有敌机来袭的事件中,每个雷达兵准确预报的概率。而横坐标则为特异性,表示了在所有非敌机来袭信号中,雷达兵预报错误的概率。由于每个雷达兵的预报标准不同,且得到的敏感性和特异性的组合也不同。将这些雷达兵的预报性能进行汇总后,雷达兵管理员发现他们刚好在一条曲线上,这条曲线就是我们经常在医学杂志上看见的ROC曲线

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值