论文阅读：Learning from Noisy Labels with Complementary Loss Functions

最新推荐文章于 2023-05-03 18:46:10 发布

一线之隔

最新推荐文章于 2023-05-03 18:46:10 发布

阅读量1.1k

点赞数

分类专栏： paper 文章标签： python 机器学习深度学习

本文链接：https://blog.csdn.net/qq_44622669/article/details/121437207

版权

paper 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文探讨了在处理带有噪声标签的数据时，交叉熵损失函数（CELoss）容易过拟合，而均方误差（MAE）损失函数可能欠拟合的问题。作者提出结合两者，利用互补损失函数来改善模型训练。在预热阶段使用CELoss，后续阶段则引入稳定输出的简单样本和困难样本，通过集成学习和伪标签策略减少过拟合，提高学习效率。实验表明，这种策略在复杂数据集上表现更优。

摘要由CSDN通过智能技术生成

Learning from Noisy Labels with Complementary Loss Functions

Abstract
Introduction
Method
Reason

整理了文章的关键内容，内容源自 Learning from Noisy Labels with Complementary Loss Functions。

Abstract

鲁棒损失函数：容易发生欠拟合，可能不能完全学习到数据集的特征
CE交叉熵损失函数：容易过拟合，通过迭代会过拟合噪声标签
作者联合两种损失函数进行训练，实现互补

Introduction

作者将现在的噪声处理方式分为以下四大类：
- label transition matrix噪声转移矩阵
- importance reweighting样本重新加权
- self/co-training strategy从模型本身或协同学习的模型中学习
- the robust loss functions鲁棒的损失函数
robust loss functions可以有效防止过拟合，但会出现欠拟合问题；
CELoss不易出现欠拟合，但在噪声数据集中会过拟合；
已经有相关工作将二者结合，但是其只有部分鲁棒，对复杂数据集效果不佳

Method

现有方法的假设：标签噪声是均匀或者类相关的
CE和MAE在噪声鲁棒性上：

如果考虑样本类别的整体分布是均匀的

可以发现MAE满足对称条件，在文献中可以知道MAE对满足假设的噪声是鲁棒的
相反CELoss是标签敏感的
CE和MAE在学习效率上：
CE和MAE对模型参数求梯度：

显而易见，当在干净的数据集中，f_j(x)如果很小(不接近1，预测不准)，那么CE带来的梯度很大；但是MAE对所有预测的态度是一致的，因此拟合速度较慢，容易欠拟合
欠拟合问题导致归一化loss不能独立作为loss函数
给出结论，即loss函数的选取是在过拟合和欠拟合中找折中
Learning with Complementary Loss Functions
主要算法：

T_warmup之前，模型可以直接从原始数据集用CELoss直接学习
T_warmup之后，CELoss有过拟合趋势，此时采用Complementary Loss