ROC曲线绘制和AUC计算

高级生信攻橙诗~

已于 2024-05-13 14:01:17 修改

阅读量1.9k

点赞数 24

文章标签： python 机器学习分类生物信息学

于 2023-11-30 13:32:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ccc_bioinfo/article/details/134710035

版权

ROC曲线是评估二分类模型性能的工具，以FPR为横轴，TPR为纵轴。AUC越大表示模型性能越好。AUC在0.5-1之间，0.5表示随机猜测，1表示完美区分。ROC曲线帮助在医学诊断中权衡灵敏度和特异性。可以用Python计算和绘制ROC曲线及AUC。

摘要由CSDN通过智能技术生成

ROC曲线绘制和AUC计算

文章目录

ROC曲线绘制和AUC计算

1.什么是ROC曲线？

ROC曲线（Receiver Operating Characteristic curve）是一种用于评估二分类模型性能的工具。它以假正例率（False Positive Rate，FPR）为横轴，真正例率（True Positive Rate，TPR）为纵轴绘制曲线。如下图。
在这里插入图片描述

2.ROC曲线怎么看？

在ROC曲线中，曲线下方的面积（Area Under the Curve，AUC）越大，表示模型性能越好。
理想情况下，ROC曲线应该靠近左上角，表明模型在保持较低的假正例率的同时实现较高的真正例率。当ROC曲线与对角线重合时，说明模型性能等同于随机猜测。

3.怎么计算AUC？

计算AUC的方法通常涉及到对ROC曲线下的面积进行数值积分。具体步骤如下：

绘制ROC曲线：通过改变分类阈值，计算不同阈值下的TPR和FPR，然后绘制曲线。 计算AUC：
对ROC曲线下的面积进行数值积分。在离散数据的情况下，可以使用梯形法则或其他数值积分方法。

梯形法则计算AUC的简单方法是将ROC曲线分成多个小梯形，然后计算每个梯形的面积并求和。具体计算公式为：
在这里插入图片描述

其中，n 是ROC曲线上的点数，FPRi 和TPRi 分别是第 i个点的假正例率和真正例率。

4.AUC的数值有什么含义？

AUC的取值范围在0到1之间，见下图：
在这里插入图片描述

AUC = 0.5：表示模型的性能等同于随机猜测。ROC曲线是一条对角线，说明模型无法区分正例和负例，其预测能力没有优势。
AUC < 0.5：表示模型性能差于随机猜测。这可能是因为模型在正例和负例之间混淆，甚至错误地更倾向于预测反方向。
AUC > 0.5：表示模型性能优于随机猜测。AUC越接近1，模型性能越好。当AUC接近1时，说明模型在正例和负例之间的区分能力更强。
AUC = 1：表示模型在所有情况下都完美地区分了正例和负例，没有产生任何错误。尽管在实际应用中极少见，但AUC等于1表示模型的性能是理想的。

5.为什么要采用TPR和FPR来做ROC曲线

这两个指标的定义为：
在这里插入图片描述

在理解这两个指标时，可以考虑以下关系：

TPR提高：意味着模型更能捕获实际为正例的样本，降低了漏诊的风险。
FPR提高：意味着模型在实际为负例的样本中更容易出现误报，将其错误地预测为正例。

在实际应用中，医学领域可能更关心提高灵敏度（降低漏诊率），金融领域可能更关心降低误报率（提高特异性），而具体的权衡取决于问题的特性和业务需求。

6.TPR、FPR与灵敏度、特异性的关系是什么？

灵敏度 = TPR
特异性 = 1 - FPR

最低0.47元/天解锁文章

高级生信攻橙诗~

关注

24
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。