【推荐系统的评估】离线评估指标AUC

淅淅沥沥的小太阳

已于 2024-05-05 20:10:55 修改

阅读量1.3k

点赞数 11

分类专栏：推荐系统文章标签：人工智能算法

于 2024-05-04 23:11:58 首次发布

本文链接：https://blog.csdn.net/m0_53259482/article/details/138451357

版权

一、AUC的两种理解

1.1、ROC曲线下方的面积

实际值\预测值	正P	负F
正P	TP	FN
负F	FP	TN

True positive(TP)，称为真阳率，表明实际是正样本预测成正样本的样本数
False positive(FP)，称为假阳率，表明实际是负样本预测成正样本的样本数
False negative(FN)，称为假阴率，表明实际是正样本预测成负样本的样本数
True negative(TN)，称为真阴率，表明实际是负样本预测成负样本的样本数

ROC曲线的横坐标为False Positive Rate（FPR，假阳性率），所有负样本中被错判为正的样本数所占的比例，显然，我们不希望该指标太高。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

淅淅沥沥的小太阳

关注关注

11
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

推荐系统之ROC和AUC详解

qq_38375203的博客

07-21

2745

这个绝对是重量级内容了，也是很基础的东西。对于模型来讲，不同的阈值会有不同的泛化能力，这时候，如果想比较两个模型的泛化能力，这个阈值的高低也会受到影响，所以就需要能够综合考虑着所有阈值下的模型的泛化性能，这样还可以使得模型适应与不同的任务，那这时候应该怎么评估模型呢？ROC曲线是常用的工具。在这里和我们前面说过的PR曲线是类似的（mAP）,但是在之前的PR曲线中横纵坐标是查准率和查全率。目标检测指标mAP详解。............

推荐系统离线评估常用指标

Root__God的博客

12-17

702

准确率、召回率、F1、MAE、RMSE、MSE

参与评论您还未登录，请先登录后发表或查看评论

ROC曲线和AUC，推荐系统中常用AUC作为排序模型的评估指标

m0_48086806的博客

06-13

1436

ROC曲线和AUC，推荐系统中常用AUC作为排序模型的评估指标

推荐系统之AUC指标的一些理解

mathlxj的博客

04-03

1715

以下是在一些整理的和自己的关于AUC的理解。

推荐系统-排序层：AUC

u013250861的博客

08-12

803

AUC是评估模型排序能力的指标，logloss是评估准确度的指标，用来排序的依据是概率值auc值是一个概率值，意味着正样本排在负样本前面的概率。

推荐系统评价指标/ROC/AUC（附代码）

qq_43288397的博客

03-15

842

P-R曲线上一个点代表着，某一阈值下，模型将大于该阈值的结果判为正样本，小于该阈值的为负样本，此时返回结果对应的召回率和精确率。从计算概率的角度理解AUC，随机抽出一对样本（一个正样本，一个负样本），然后用训练得到的分类器来对这两个样本进行预测，预测得到。一共有MxN对样本（一对样本即，一个正样本与一个负样本），先统计这MxN对样本里，正样本的预测概率大于负样本的预测概率的个数。在（D,B）样本对中，正样本D预测的概率大于负样本B预测的概率（也就是D的得分比B高），记为1。曲线A完全包住曲线B，那么A好。

推荐系统--评估方法和评估指标

weixin_42727538的博客

04-25

1857

如何理解推荐系统离线和线上auc和线上点击率不一致的问题？

sixgold的博客

04-24

2995

目录1. 特征/数据出现穿越2. 线上线下特征不一致3. 数据分布的不一致离线指标和线上指标不一致是个常见的问题，花了很大力气好不容易离线auc涨了不少，上线一看效果ctr和cpm反而下降。本文例举几种可能的原因和解决办法。 1. 特征/数据出现穿越一般就是使用了和label强相关的特征导致的数据泄漏。这种问题一般相对好查，很多时候在离线阶段就能发现。明显的表现就是训练集和测试集差异比较大 2...

Uplift Model离线评估指标

Swift's Blog

09-16

1151

uplift建模难点在于无法获得个体的ground truth，因为它是反事实的。只能通过构造treatment和control两组镜像人群，对比两组人群的转化增量，来实现模型性能的评估。more。

推荐系统实战（九）评估与调试

Willowii的博客

08-30

1250

（一般来说使用3或7天的历史数据作为训练数据，第4天或第8天的历史数据作为测试数据。

【0】推荐系统中评价指标

j_qin的博客

11-04

1344

评价指标

推荐系统TOP-K指标AUC和CTR指标AUC的异同

springtostring的博客

01-27

2196

常用推荐系统评测指标

weixin_46351593的博客

06-05

4558

样本负采样为什么不影响AUC计算？

qq_23236081的博客

12-16

1810

AUC 指标为什么对于正负样本比例不敏感？线上线下效果不一致有哪些原因？

AUC的含义——及线上线下不一致性分析

程序认生

05-14

3377

一、前言在算法面试中，常常会被一个问题AUC的物理含义是什么。其物理含义是：测试任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。举例说明一下：样本：y=1，y = 1， y=1， y = -1， y = -1， y = -1 模型1的预测：0.8，0.7，0.3，0.5，0.6，0.9 模型2的预测：0.1， 0.8， 0.9， 0.5， 0.85， 0.2 真实label中正负样本对为3*3=9 模型1：正样本score大于负样的对包括(y1

多高的AUC才算高？

LegenDavid's warehouse

08-02

4349

问题的引出 AUC这个指标有两种解释方法，一种是传统的“曲线下面积”解释，另一种是关于排序能力的解释。例如0.7的AUC，其含义可以大概理解为：给定一个正样本和一个负样本，在70%的情况下，模型对正样本的打分高于对负样本的打分。可以看出在这个解释下，我们关心的只有正负样本之间的分数高低，而具体的分值则无关紧要。我们在各种分享中常常会看到，某大牛的某模型

模型评估方法(AUC等)

lihonst的专栏

10-06

3428

模型评估方法，适合初学者入门

推荐系统遇上深度学习(九)--评价指标AUC原理及实践

简书博客搬家测试账号

08-13

738

欢迎关注天善智能，我们是专注于商业智能BI，人工智能AI，大数据分析与挖掘领域的垂直社区，学习，问答、求职一站式搞定！对商业智能BI、大数据分析挖掘、机器学习，python，R等数据领域感兴趣的同学加微信：tsaiedu，并注明消息来源，邀请你进入数据爱好者交流群，数据爱好者们都在这儿。本文来自天善智能社区专栏作者[文文](https://ask.h...

离线与在线auc不一致问题

来自Daisy和她的单程车票

03-21

1470

阅读论文：Predictive Model Performance: Offline and Online Evaluations 1、离线AUC、RIG有迷惑性（线上线下不一致）、auc忽略了预测得分，只关注顺序(正样本排在负样本之前) auc 越高并不意味着有更好的排序 AUC不能区分ROC空间的各个区域，所以仅通过优化数据两端的模型性能就可以训练模型以最大化AUC分数。实际上，高估pClick得分范围内的点击概率比低估pClick得分范围时对在线性能的影响要小低pClick范围内pClick得分

推荐系统算法评价指标代码实现