ROC曲线

ROC曲线是评估分类模型性能的重要工具,它通过绘制真正例率(TPR)与假正例率(FPR)的关系来展示模型的辨别能力。文章介绍了ROC曲线的计算方法,包括将样本按概率排序,设定阈值,计算TPR和FPR,并举例说明如何根据概率绘制ROC曲线坐标点。TPR表示正类预测准确率,FPR表示误判负类的比例。通过ROC曲线,可以直观地看出模型在不同阈值下的表现。
摘要由CSDN通过智能技术生成

ROC曲线是一种用来度量分类模型好坏的一个标准,全名叫做Receiver Operating Characteristic。ROC曲线绘制时,首先将每个样本属于正样本的概率进行大小排序,再依次以每个样本属于正样本的概率作为阈值。高于这个阈值被视为正样本,低于这个阈值视为负样本。由此进行计算,得到该样本的FPR和TPR,并以此为坐标点。
TPR代表分类器预测的正类中实际正实例占所有正实例的比例。
FPR代表分类器预测的正类中实际负实例占所有负实例的比例
计算公式分别为
T P R = T P T P + F N \\TPR = \frac{{TP}}{{TP + FN}}\\ TPR=TP+FNTP
F P R = F P F P + T N   \\FPR = \frac{{FP}}{{FP + TN}}\, FPR=FP+TNFP
参考ROC绘制实例如下:
在这里插入图片描述
score即为每个样本属于正样本的概率,class为样本真实的类别。
计算部分样本的坐标点(TPR,FPR)
以第3个样本为例,此时样本属于正样本的概率为0.7,所以以0.7作为阈值。概率大于0.7的样本视为正样本,小于0.7的是负样本。即样本1、2、3都被视为正样本,其余样本为负样本。此时的TP(被正确分类的正例)有2个,FN(被错分为负例的正例)有8个,TN(True Negative被正确分类的负例)有9个、FP(False Positive被错分为正例的负例)有1个,所以此时TPR为0.2,FPR为0.1
在这里插入图片描述
绘制ROC曲线
在这里插入图片描述
小菜鸟刚刚搞懂的基础概念 自我记录一下

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值