ROC曲线

ROC曲线,通俗来说,我们建立一个分类模型,但是这个分类模型不是直接告诉你这个属于类P那个属于类N,它会告诉你通过它的特征这个属于类P的概率是多少,这种情况下我们就要找一个阈值,通过这个阈值来判断是属于类P还是属于类N,比如我们可以说当超过阈值是属于类P否则属于类P。说了那么多我们来看个例子更容易理解
在这里插入图片描述
这里有一个数据,第一列数据是序号列,第二列数据为数据真实的类别列,第三列数据为分数列(这个是分数不是概率,不过一般都是概率,这里是分数效果也是一样的),然后我们就可以分数去预测类别,这时我们就需要找到一个阈值。我们找到一个阈值容易,但是如何找到一个最好的阈值呢,这里就涉及到判断阈值的效果的方法
这里我们需要引用两个指标TPR和FPR,TRP=判断为真且确实为真个数/所有真实为真的个数
FPR=判断为真但是却是假的个数/所有为假的个数
这样如果TPR越大且FPR越小越好,这样对于不同的阈值就可以有不同的TPR和FPR这样就可以画出以FPR为x轴以TPR为y轴的曲线图
在这里插入图片描述
这里每个点都是不同的阈值对应的FPR和TPR值,我们找到最靠近左上角的点对应的阈值就是最好的阈值了。而这个曲线就是ROC曲线了
上图的AUC表示ROC曲线下的面积,介于0到1之间,这个数值可以直观的评价分类器的好坏,值越大越好。(如果分类器不好即使找到最好的阈值预测分类效果也不好)
参考文献:
ROC曲线的通俗理解
全面了解ROC曲线
如果想用R语言画ROC曲线可以参考这篇文章
R语言-绘制ROC曲线

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值