深度学习-AUC/PR计算

最新推荐文章于 2024-04-23 05:45:30 发布

368chen

最新推荐文章于 2024-04-23 05:45:30 发布

阅读量1.8k

点赞数

分类专栏：项目-深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16236875/article/details/100669665

版权

项目-深度学习专栏收录该内容

48 篇文章 0 订阅

订阅专栏

1 AUC ：AUC 表示随机抽取一个正样本和一个负样本，分类器正确给出正样本的score高于负样本的概率，在所以标注样本中，正样本共T个，负样本共F 个，如果随机抽取一个正样本和负样本，共有T*F 个pair，其实如果有s个pair 的正负样本pair 满足于正样本的score 高于负样本(权重为1），v个pair 正负样本score 相同（权重为0.5），则AUC就等于(s+0.5v)/(T*F).

1 根据定义，由梯形法计算ROC 曲线下的面积，求auc

2 变量全部样本，对正负pair 的数目计数，求AUC。

3 从高到底依次将score 值作为阈值，当测试样本属于正样本的概率大于或等于这个threshold 时，我们认为它为正样本，否则为负样本，每次选取一个不同的threshold，就可以得到一组FPR和TPR，即ROC曲线上的一点，这样一来，我们一共得到了20组FPR和TPR的值，将它们画在ROC曲线。

2 PR 曲线

PR 曲线的横坐标是召回率，纵坐标是准确率，对于一个排序模型来说，其PR 曲线上的一个点代表：在某一个阈值下，模型将大于该阈值的结果判定为正样本，整条PR 曲线是通过将阈值从高到低移动而生成的。所以可以整体地比较在不同阈值下模型预测的水平。

但是有个问题是离线评测数据集的数据分布往往跟线上环境的数据集分布不同，比如你的离线数据集正负样本比例为1:1，线上样本比例1:100，这是PR 曲线就不适用了，需要ROC 曲线。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。