交叉熵下的模型评估,auc还是loss?

在模型评估中,AUC和Loss是两个关键指标。当两者趋势不一致时,若训练和测试集分布一致,应关注Loss;反之,分布不一致时,应重视AUC。训练集和测试集的分布一致性可通过比较标签比例来判断。选择指标应依据数据特性,确保模型在目标分布上的性能。
摘要由CSDN通过智能技术生成
    评估模型的好坏我们经常使用2个指标,auc和loss。但是有的时候我们发现auc和loss趋势并不是一致的,比如loss下降,auc也下降,那当loss和auc趋势不一致时到底应该以哪个指标为准呢?我的经验是,如果测试集和训练集的分布是一致的,那应该以loss为准,因为模型本身优化的就是loss最低,所以从这个角度看,loss低意味着模型优化的方向是对的,auc低大概率也只是暂时在这部分测试集的表现。但是如果训练集和测试的分布不一致,或者分布差异较大,这个时候则需要以auc为准,因为这个时候的loss其实带有了较大的系统误差,比如预估值整体左偏或者右偏,直观表现就是pcoc会显著偏离1。那如何判断训练集和测试集的分布是否一致呢?最简单的方法,直接统计label中每种类型的比例,如果训练集和测试集相差不大,说明分布差异较小。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值