AUC计算

最新推荐文章于 2025-03-26 23:07:32 发布

赵大寳Note

最新推荐文章于 2025-03-26 23:07:32 发布

阅读量1.5k

点赞数 1

分类专栏：机器学习算法文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010412858/article/details/106794003

版权

机器学习算法专栏收录该内容

33 篇文章

订阅专栏

AUC: Area Under Curve, 默认为ROC(receiver operating characteristic curve) Curve, 也可以指定PR(Precision Recall) curve。

由于ROC曲线的X轴为False Positive Rate，Y轴为True Positive Rate，AUC是可以指 随机给定一个正样本和一个负样本，分类器输出该正样本为正的比输出该负样本为正要大的概率，即 AUC = P(P_tpr > P_fpr).

AUC的计算方法：

在有M个正样本,N个负样本的数据集里。一共可构成 MN 个样本对（一对样本即，一个正样本与一个负样本）。统计这MN对样本里，正样本的预测概率大于负样本的预测概率的个数。
$C=\frac{\sum_{i \in \text { positiveclass }} \operatorname{rank}_{i}-\frac{M(1+M)}{2}}{M \times N}$

def AUC(label, pre):
　　#计算正样本和负样本的索引，以便索引出之后的概率值
    pos = [i for i in range(len(label)) if label[i] == 1]
    neg = [i for i in range(len(label)) if label[i] == 0]
 
    auc = 0
    for i in pos:
        for j in neg:
            if pre[i] > pre[j]:
                auc += 1
            elif pre[i] == pre[j]:
                auc += 0.5
 
    return auc / (len(pos)*len(neg))
 
 
if __name__ == '__main__':
    label = [1,0,0,0,1,0,1,0]
    pre = [0.9, 0.8, 0.3, 0.1, 0.4, 0.9, 0.66, 0.7]
    print(AUC(label, pre))
 
    from sklearn.metrics import roc_curve, auc
    fpr, tpr, th = roc_curve(label, pre , pos_label=1)
    print('sklearn', auc(fpr, tpr))

1、多分类可以计算AUC吗？

可以。通过one VS rest可以得到M个AUC，最后求均值。

2、AUC的阈值怎么选取最佳？

曲线靠近左上角对应的阈值最佳，代表TPR大于FPR的最大机会。

3、类别不平衡对AUC_roc和AUC_pr哪个影响大？

ROC不受训练集类别分布的影响

References:

1、 AUC的计算方法
2、https://developers.google.com/machine-learning/crash-course/classification/roc-and-auc
3、

博客等级

码龄12年

116
原创

511
点赞

1541
收藏

209
粉丝

关注

私信

热门文章

分类专栏

大数据 3篇
编程算法笔记 18篇
机器学习算法 33篇
推荐系统 13篇
python笔记 28篇
深度学习 11篇
Keras 2篇
心情日记 2篇
Go笔记 1篇
Linux笔记 11篇
区块连 2篇
Git笔记 1篇
论文笔记 1篇
笔试 2篇
C++笔记 17篇
Spark笔记 2篇
数据科学 2篇
LaTeX 2篇
秋招实
实用工具 6篇
SQL 1篇
数学笔记 1篇

展开全部收起

最新评论

C++中的平方、开方、绝对值怎么计算
赵贺辞9331: sqrt里面的数必须是正数吗
中文数字转阿拉伯数字
顶天立地大头葱: 感谢up！个人觉得可以直接列表初始化，看起来更简洁一些呢。 unordered_map<wchar_t, int> chineseToArabic = { {L'零', 0}, {L'一', 1}, {L'二', 2}, {L'三', 3}, {L'四', 4}, {L'五', 5}, {L'六', 6}, {L'七', 7}, {L'八', 8}, {L'九', 9}, {L'十', 10}, {L'百', 100}, {L'千', 1000}, {L'万', 10000}, {L'亿', 100000000} };
中文数字转阿拉伯数字
Simon-son: 34行，佰写成了玖。
C++常用头文件
CSDN-Ada助手: 非常感谢您分享的《C++常用头文件》这篇博客，对初学者来说非常实用。我觉得下一篇博客可以写一下C++中的多态性和继承，探讨如何更好地利用这些特性来提高代码质量和灵活性，这样的技术文章对其他C++开发者也会非常有帮助。相信您的博客会吸引更多读者关注，期待您的下一篇作品。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Tensorboard 6006端口无法访问的问题
捂耳听风暖: 成功解决，太感谢啦！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。