ROC 与 AUC

最新推荐文章于 2024-06-11 21:00:00 发布

xieshangxin

最新推荐文章于 2024-06-11 21:00:00 发布

阅读量349

点赞数

下面使用逻辑回归来解释两者之间的差别。

假设你有两种类型的老鼠，肥胖（蓝色），不肥胖（红色）。

这只老鼠不是肥胖的，虽然它比较重，

这只老鼠不算重，但它是肥胖的。

现在使用逻辑回归对数据进行拟合。

此时 y 轴就表示一个老鼠属于肥胖型的概率。

对于一个待预测的老鼠（黑点），逻辑回归模型告诉我们，这只老鼠属于肥胖型的概率很高。

如果待测老鼠位于下图位置，回归曲线告诉我们，这只老鼠是肥胖型的概率很低。

我们需要将概率转化为分类，常用的方法是设置一个阈值，比如0.5。将概率大于0.5的老鼠归类为肥胖，将概率小于0.5的老鼠归类为不肥胖。

以下为4只不肥胖的老鼠

以下这4只老鼠肥胖。

以上为两个错分的情况。

根据分类结果计算混合矩阵，并计算敏感性和特异性。

现在，如果我们使用不同的阈值来做分类，比如正确地分类每个肥胖的老鼠很重要的话，我们将阈值设置为 0.1。这达到了正确分类每个肥胖老鼠的目的，但是会导致不肥胖老鼠的错分。

如果我们将阈值设置的很高，比如0.9。这就回导致很多肥胖老鼠的错分。

‘

事实上阈值的选择范围是0-1,那么到底哪个阈值是最好的呢？每个不同的阈值可能对应不同的混合矩阵。我们不需要测试每个不同的阈值（当然也不可能做到），故使用ROC曲线来表示不同的阈值的情况。

阈值从低到高，点从（1,1）逐渐往（0,0）移动：

最后，所有的老鼠都被归为不肥胖。

连接所有的点，就得到ROC曲线，曲线上的每个点都代表一个混合矩阵。

根据对肥胖错误估计的容忍度，我们可以决策出哪个点是最优的。

AUC 就是线下的面积

’

AUC 帮助我们选择哪条ROC曲线更好，下图红色的线比蓝色的更好。如果红色的线是逻辑回归得到的，蓝色的线是随机森林得到的，那么你应该选择逻辑回归做数据的预测。

另外，在数据不平衡的情况下，人们可能会使用精度，代替假阳率。因为它不需要考虑负类样本的个数。也就不会受到数据不平衡的影响。

总结来说，ROC帮助你决定哪个阈值更好；AUC帮你判断哪个模型更好。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ROC 与 AUC

下面使用逻辑回归来解释两者之间的差别。假设你有两种类型的老鼠，肥胖（蓝色），不肥胖（红色）。这只老鼠不是肥胖的，虽然它比较重，这只老鼠不算重，但它是肥胖的。现在使用逻辑回归对数据进行拟合。此时y轴就表示一个老鼠属于肥胖型的概率。对于一个待预测的老鼠（黑点），逻辑回归模型告诉我们，这只老鼠属于肥胖型的概率很高。如果待测老鼠位于下图...
复制链接

扫一扫

xieshangxin CSDN认证博客专家 CSDN认证企业博客

码龄7年

115: 原创

5万+: 周排名

170万+: 总排名

19万+: 访问

: 等级

2351: 积分

58: 粉丝

109: 获赞

37: 评论

657: 收藏

私信

关注

热门文章

分类专栏

Ubuntu 2篇
软链接 1篇
空间不足 1篇

最新评论

opencv 物体尺寸测量
天是天海是海: 像素和真实距离换算比怎么确定的
t-SNE的通俗易懂解释
Christina-mc: 讲得很好！能懂！但是好像戛然而止了，没写完？
t-SNE的通俗易懂解释
halo～*: 你好，我想问可视化后横纵坐标是啥
opencv 物体尺寸测量
Seven、K: 这种方法是不是需要相机拍照时垂直于目标
opencv 物体尺寸测量
mlh1290: 请问，测量精度能达到0.01mm么？配合高速摄像机能达到每秒120次计算么？？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。