类不平衡(样本不均衡数据)处理笔记+ROC/AUC曲线

在这里插入图片描述

划分训练集测试集时

在这里插入图片描述

在这里插入图片描述
函数train_test_split中的参数stratif
在这里插入图片描述

ROC曲线

为什么提出ROC曲线

在不同的应用任务中,我们可根据任务需求来采用不同的阈值。

例如,若我们更重视“查准率”,则可以把阈值设置的大一些,让分类器的预测结果更有把握;若我们更重视“查全率”,则可以把阈值设置的小一些,让分类器预测出更多的正例。

因此,阈值设置的好坏,体现了综合考虑学习器在不同任务下的泛化性能的好坏。为了形象的描述这一变化,在此引入ROC曲线,ROC曲线则是从阈值选取角度出发来研究学习器泛化性能的有力工具。

什么是ROC曲线

ROC曲线的纵轴是“真正例率”(True Positive Rate, 简称TPR),横轴是“假正例率”(False Positive Rate,简称FPR)

ROC具体细节

在这里插入图片描述

意义

在这里插入图片描述

为什么提出AUC

两条曲线发生交叉,则难以判断谁好谁坏。
进行比较时采用AUC
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值