评估模型的好坏我们经常使用2个指标,auc和loss。但是有的时候我们发现auc和loss趋势并不是一致的,比如loss下降,auc也下降,那当loss和auc趋势不一致时到底应该以哪个指标为准呢?我的经验是,如果测试集和训练集的分布是一致的,那应该以loss为准,因为模型本身优化的就是loss最低,所以从这个角度看,loss低意味着模型优化的方向是对的,auc低大概率也只是暂时在这部分测试集的表现。但是如果训练集和测试的分布不一致,或者分布差异较大,这个时候则需要以auc为准,因为这个时候的loss其实带有了较大的系统误差,比如预估值整体左偏或者右偏,直观表现就是pcoc会显著偏离1。那如何判断训练集和测试集的分布是否一致呢?最简单的方法,直接统计label中每种类型的比例,如果训练集和测试集相差不大,说明分布差异较小。
交叉熵下的模型评估,auc还是loss?
最新推荐文章于 2024-05-23 01:01:31 发布
在模型评估中,AUC和Loss是两个关键指标。当两者趋势不一致时,若训练和测试集分布一致,应关注Loss;反之,分布不一致时,应重视AUC。训练集和测试集的分布一致性可通过比较标签比例来判断。选择指标应依据数据特性,确保模型在目标分布上的性能。
摘要由CSDN通过智能技术生成