auc 和loss_关于模型评估指标，可比性，LOSS，AUC，上下限

最新推荐文章于 2024-01-20 21:16:53 发布

weixin_39853968

最新推荐文章于 2024-01-20 21:16:53 发布

阅读量1.8k

点赞数

文章标签： auc 和loss

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39853968/article/details/111747404

版权

本文探讨了模型评估中的AUC和LOGLOSS指标，指出它们在不同场景下的可比性和适用性。AUC适用于二分类的排序问题，而LOGLOSS对数据分布敏感，更适合多分类。在模型选择时，需要根据场景理解模型的优缺点，例如AUC高的模型可能更保守，LOGLOSS低的模型可能预测更果断。此外，文章还介绍了熵、交叉熵和KL散度等概念，帮助深入理解模型评估。

摘要由CSDN通过智能技术生成

模型评估可以从多维度多指标进行评估。

这里只谈论指标。

我们常用的指标，logloss，mse，auc(GAUC)等等。

其他指标包括gini(2*AUC -1)，PRauc，KS(max(TPR−FPR))，acc，precision，F1 score。

对于预估分数的指标包括其分布的值，比如CoV(变异系数)，std，avg，等等。还有别的指标，如oe等。

首先，需要明确，这些指标有没有可比性，在什么情况下有。

例如，在ctr预估中，logloss，mse在不同问题，不同数据集，不同评估维度下(数据集分片)没有直接可比性。因为logloss的大小和问题的难度成直接关联(问题越简单，logloss越小。这里指Bayesian Risk，例如一个问题中，ctr大概有2%，那么你预估所有商品都是0.02时，logloss= - 0.02 * ln 0.02 - 0.98 * ln 0.98 = 0.09，而ctr有50%时，盲猜0.5的logloss为0.67)，所以，取决于问题，不可直接比。同理，因为一些数据的变化，不同的数据集，不同数据分片，也不具备可比性。

所以一般比较的对象都在相同的数据集上，我们去对比模型的相对差异。比如a模型比b模型logloss小了2%。

这些指标的含义

一般经验上来说，如果二分类(大多数在排序场景运用的话)，用auc比较直接。在多分类的情况下，logloss

最低0.47元/天解锁文章

weixin_39853968

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。