离线与在线auc不一致问题

最新推荐文章于 2022-06-03 22:35:49 发布

Daisy和她的单程车票

最新推荐文章于 2022-06-03 22:35:49 发布

阅读量1.3k

点赞数

分类专栏：推荐系统文章标签：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012513618/article/details/115051195

版权

本文探讨了离线AUC、LogLoss和NDCG等评估指标在推荐系统中的应用及其局限性。离线AUC可能无法准确反映模型的预测准确性，LogLoss关注数据吻合度，而NDCG强调相关结果的排名。在线评估时，应考虑不同流量的表现。模拟指标可用于拍卖模拟，结合历史数据评估模型性能。

摘要由CSDN通过智能技术生成

阅读论文：Predictive Model Performance: Offline and Online Evaluations

1、离线AUC、RIG有迷惑性（线上线下不一致）

auc忽略了预测得分，只关注顺序(正样本排在负样本之前)
auc 越高并不意味着有更好的排序
AUC不能区分ROC空间的各个区域，所以仅通过优化数据两端的模型性能就可以训练模型以最大化AUC分数。
实际上，高估pClick得分范围内的点击概率比低估pClick得分范围时对在线性能的影响要小
低pClick范围内pClick得分的高估可能会给劣质广告带来更高的选择机会，从而会对在线指标产生重大负面影响

2、预测点击得分较低的商品对在线的性能影响更大（得分较低的商品），【errors in predictions in the very low range of predicted click scores impact the online performance much more negatively than errors in
other regions ）

3、 auc平衡了平均权衡了遗漏和佣金错误；如不在主banner投放最佳广告（遗漏错误）的成本远远超过放置次优广告的罚款(佣金错误)，当误分类成本不相等时，总结所有可能的阈值是不准确的。

4、AUC高度依赖于数据的基础分布。在两个相同的数据集上，使用不同的负样本率，AUC会完全不同；

注意：对于正负样本极不均衡的数据集，尤其是负样本比例极高，此时auc较高，并不一定意味这该模型具有较好的预测性能

几个指标之间的区别<

最低0.47元/天解锁文章

Daisy和她的单程车票

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。