如何加理解（两个模型）准确率（ACC）和AUC变化不一致

最新推荐文章于 2024-12-23 00:18:41 发布

Xiaofei@IDO

最新推荐文章于 2024-12-23 00:18:41 发布

阅读量4.2k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nixiang_888/article/details/116191478

版权

本文探讨了在二分类模型中，AUC（曲线下面积）和正确率（ACC）可能存在不一致的情况。模型A正确率85%，AUC 0.98，模型B正确率93%，AUC 0.92。文章指出，正确率依赖于特定截断值，而AUC综合所有截断值，更适合处理偏态样本。因此，建议依据AUC选择模型，推荐使用AUC作为评估和比较分类器的单一指标。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 问题

当我们建立两个模型都是二分类的，并应用常见的Logistic回归模型得到结果如下：模型A的正确率为85%，AUC为0.98；模型B的正确率为93%，AUC为0.92。那么选择哪个模型呢？

很多朋友首先应该会质疑方法使用的正确性，不过出现这个问题的可能性很小，我们假设方法是正确的，主要探讨AUC和正确率矛盾的问题。

查阅文献，发现不少朋友也遇到同样的问题，更巧的是已有学者通过模拟研究证实矛盾的存在。下面图表中的最后一列展示的正是AUC和正确率结论的一致比例，较低可达93.5%。
在这里插入图片描述

2. 解释

接着我们从简单的理论出发解释一下，两者出现矛盾的可能原因。正确率是基于较佳的截断值计算的，所以很多朋友觉得他应该可靠。但是他们可能不知道， AUC是基于所有可能的截断值计算的，AUC应该更加稳健 。

怎么理解“稳健”这个词呢？
我们可以理解为计算正确率时所基于的较佳截断值并不是总体分布中的较佳截断值，正确率只是某个随机样本的一个属性指标。而AUC不关注某个截断值的表现如何，可以综合所有截断值的预测性能，所以正确率高，AUC不一定大，反之亦然。

“The implicit goal of AUC is to deal with situations where you have a skewed sample distr

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。