机器学习之类别不平衡问题 (2) —— ROC和PR曲线

最新推荐文章于 2024-04-16 16:48:04 发布

VIP文章 massquantity

最新推荐文章于 2024-04-16 16:48:04 发布

阅读量4.6k

点赞数 5

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wydyttxs/article/details/79594712

版权

机器学习之类别不平衡问题 (1) —— 各种评估指标
机器学习之类别不平衡问题 (2) —— ROC和PR曲线

完整代码

ROC曲线和PR（Precision - Recall）曲线皆为类别不平衡问题中常用的评估方法，二者既有相同也有不同点。本篇文章先给出ROC曲线的概述、实现方法、优缺点，再阐述PR曲线的各项特点，最后给出两种方法各自的使用场景。

ROC曲线

这里写图片描述
ROC曲线常用于二分类问题中的模型比较，主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。具体方法是在不同的分类阈值 (threshold) 设定下分别以TPR和FPR为纵、横轴作图。由ROC曲线的两个指标， $TPR = \frac{TP}{P} = \frac{TP}{TP+FN}$ ， $FPR = \frac{FP}{N} = \frac{FP}{FP+TN}$ 可以看出，当一个样本被分类器判为正例，若其本身是正例，则TPR增加；若其本身是负例，则FPR增加，因此ROC曲线可以看作是随着阈值的不断移动，所有样本中正例与负例之间的“对抗”。曲线越靠近左上角，意味着越多的正例优先于负例，模型的整体表现也就越好。

AUC (Area Under the Curve)

这里写图片描述
先看一下ROC曲线中的随机线，图中[0,0]到[1,1]的虚线即为随机线，该线上所有的点都表示该阈值下TPR=FPR，根据定义， TPR=T

最低0.47元/天解锁文章

关注

5
点赞
踩
34

收藏

觉得还不错? 一键收藏
3
评论
机器学习之类别不平衡问题 (2) —— ROC和PR曲线

机器学习之类别不平衡问题 (1) —— 各种评估指标机器学习之类别不平衡问题 (2) —— ROC和PR曲线完整代码ROC曲线和PR（Precision - Recall）曲线皆为类别不平衡问题中常用的评估方法，二者既有相同也有不同点。本篇文章先给出ROC曲线的概述、实现方法、优缺点，再阐述PR曲线的各项特点，最后给出两种方法各自的使用场景。 ROC曲线 ROC曲线...
复制链接

扫一扫

massquantity CSDN认证博客专家 CSDN认证企业博客

码龄15年

6: 原创

40万+: 周排名

72万+: 总排名

6万+: 访问

: 等级

520: 积分

40: 粉丝

80: 获赞

15: 评论

321: 收藏

私信

关注

热门文章

最新评论

Kaggle竞赛 —— 泰坦尼克号（Titanic）
骑驴看唱本_: 扎实啊
Kaggle竞赛 —— 泰坦尼克号（Titanic）
lalula_123: 请问提交结果后评分多少
Kaggle竞赛 —— 房价预测 (House Prices)
南山绿: 我想请教一下您这里这个排序的问题[code=python] '180' : 1 '30' : 2 '45' : 2 '190' : 3, '50' : 3, '90' : 3, '85' : 4, '40' : 4, '160' : 4 '70' : 5, '20' : 5, '75' : 5, '80' : 5, '150' : 5 '120': 6, '60' : 6 [/code] 这个1, 2, 3, 4, 5, 6是怎么排出来的？
Kaggle竞赛 —— 房价预测 (House Prices)
ANG10112 回复哇塞604: 可以去kaggle上下载
Kaggle竞赛 —— 房价预测 (House Prices)
象牙塔小明回复 qq_24497419: 数据越接近正态分布越有利于提高部分算法得准确度，所以要对偏度太大的进行处理

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。