关于AUC一些笔记

最新推荐文章于 2022-11-30 12:31:24 发布

愿航

最新推荐文章于 2022-11-30 12:31:24 发布

阅读量576

点赞数 1

文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wish_to_top/article/details/106397947

版权

关于AUC一些笔记

首先先理解一些其他概念
AUC值是怎么计算
- AUC的范围大小评估

首先先理解一些其他概念

其实真阳=召回率=敏感度
以下的分母中的非/患者表示实际的非/患者
真阳患者表示我们判断为患者实际也是患者
假阳表示我们判定为患者实际为非患者，即我个人认为这个真阳假阳中的阳为判定结果，而真或假为判定的正确性，即可推导出原先的实际状况

真阳率，假阳率

真阳率=真阳患者/患者
假阳率=假阳患者/非患者

敏感度，特异度

敏感度=真阳患者/患者
特异度=真阴患者/非患者=1-假阳率

精度，召回率

精度=真阳/判为患者人数
召回率=真阳患者/患者

准确率

（真阳+真阴）/（患者+非患者）

ROC曲线

ROC曲线就是横坐标为假阳性，纵坐标为真阳性的一个线，而AUC则是这条线与x轴围成的面积
注意ROC曲线不应用于权重不相等的分类器中

AUC值是怎么计算

具体可以参考：https://www.bioinfo-scrounger.com/archives/767/（非原作者，非常感谢这篇博客）是怎么说明的
大概思路有二种：
其一是：计算出每个样本的类别概率~~然后选定阈值，得出预测为正样本和负样本的标签，根据预测标签和真实标签就可以计算真阳率、假阳率等~~，然后将真实标签的正样本和负样本的类别概率两两组合，并计算正样本的类别概率大于负样本的类别概率的比例，即为AUC值
其二是：利用秩次关系
对score从到小排序，最大的score排序索引为n，最小的则为1；然后将正例的索引求和，减去正例-正例这种组合的个数M*(M+1)/2；最后除以M*N。

AUC的范围大小评估

这边参照这篇微信文章，取自截图https://mp.weixin.qq.com/s/S2yHZCrjaSxw386N6ziz5w

auc的分类效果
按个人理解而言，这边的AUC范围并不是固定的，因为跟数据有关，有的数据比较差的话，可能模型能达到的最优AUC也就0.8左右，所以此时强行按图观察的话可能会有误
以上均为个人理解，有误请指正，也不知道咋转载或是跟原博客说，侵删

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于AUC一些笔记

关于AUC一些笔记首先先理解一些其他概念真阳率，假阳率敏感度，特异度精度，召回率准确率AUC值是怎么计算AUC的范围大小评估首先先理解一些其他概念其实真阳=召回率=敏感度真阳率，假阳率真阳率=真阳患者/患者假阳率=假阳患者/非患者敏感度，特异度敏感度=真阳患者/患者特异度=真阴患者/非患者=1-假阳率精度，召回率精度=真阳/判为患者人数召回率=真阳患者/患者准确率（真阳+真阴）/（患者+非患者）AUC值是怎么计算具体可以参考：https://www.bioinfo-scroun
复制链接

扫一扫

愿航 CSDN认证博客专家 CSDN认证企业博客

码龄5年

54: 原创

7万+: 周排名

1万+: 总排名

16万+: 访问

: 等级

1423: 积分

250: 粉丝

287: 获赞

22: 评论

950: 收藏

私信

关注

热门文章

最新评论

孟德尔随机化--研究
congxianzhu: 最后一段 ggadjustedcurves 是什么
关于cox单因素与多因素分析
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7981574, 请多输出高质量博客, 帮助更多的人
R 一些非常用函数
hx2024: 我也来增加一条：group$X<-gsub(pattern = '-',replacement = '.',group$X)#将样本ID中的-转换为. ##group$X<-gsub(pattern = ".{1}$",replacement = '',group$X)##".{1}$"#把最后一位A替换为空格
win10下的RNA测序（二）
Thorn&: 我的keytype和楼主的一样，为什么显示Invalid keytype呢
AutoGluon-教程1-简单的入门模型
小吴老师929: 您好答主，我看了您的autogluon的文章很受启发，在自己进行实验的结果环节时候发现存在一种情况，我不知道哪一个应该作为最终的结果。我进行的是一个分类任务，设置的score_test是accuracy，在leaderboard的里面发现score_test最高的模型并不是score_val最高，而score_val最高的模型score_test是第二高的，那么这两个模型我应该选择哪一个作为我最终的结果呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。