标签噪声：综述 Learning from Noisy Labels with Deep Neural Networks: A Survey

Doctor_Strange_DML

已于 2022-09-19 22:58:05 修改

阅读量1.3w

点赞数 31

分类专栏：深度学习文章标签：人工智能深度学习机器学习

于 2022-09-19 22:53:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daimaliang/article/details/126905645

版权

原文链接：https://arxiv.org/pdf/2007.08199.pdf

github链接：GitHub - songhwanjun/Awesome-Noisy-Labels: A Survey

（本文仅做阅读笔记之用，如需了解细节可自行查看原文，翻译不周之处，敬请指正）

1. Introduction

据统计真实世界的数据集中存在的标注噪声范围在8%到38.5%。

深度神经网络（DNN）因为具有很强的拟合能力，所以很容易对噪声标签过拟合。

正则化技术（如数据增强，权重衰减，dropout，批次正则化（BN）等）虽然能缓解过拟合问题，但是光靠正则化并不能完全克服过拟合。如fig.1就形象地说明了这个问题：

无论训练数据是否有噪声（Noisy or Clean），或者是否使用了正则化技术（w/o Reg.），网络都能完全拟合训练集（train-acc 都达到了100%）
但是在测试集中存在严重的gap，用了正则化能有效缓解过拟合，但是和无噪声的数据集相比还有很大差距

此外，标签中的噪声比其他噪声（如输入的噪声）危害更大。

鲁棒训练（Robust training）还包括其他两个研究方向：对抗学习（Adversarial learning）和数据插补（data imputation），但是以上两个方向都是针对特征上的噪声，因此不在此综述（标签噪声）的讨论范围。

2. Preliminaries

A. 带噪声的全监督学习范式

符号定义，经验风险最小化，梯度下降......

B. 标签噪声的分类

（1）实例不相关的标签噪声

传统的标签噪声建模方法假设标签噪声是和数据特征无关的，使用一个过渡矩阵T来将真实标签变为噪声标签。根据此过渡矩阵的特点（标签转变的概率分布），标签噪声可以分为对称噪声（symmetric noise）和非对称噪声（asymmetric noise），非对称噪声还包括一种极端情况，此时一种标签只可能转变为另外一种噪声，称为对噪声（pair noise）。

（2）实例相关的标签噪声

在实际场景中，噪声更有可能与标签和数据本身的特征都有关系。（即某些困难样本或者模糊样本更有可能有标注错误）

C. 非深度学习的方法

数据清洗（data clean）
代理损失（surrogate loss）
概率方法（probabilistic method）
基于特定模型的方法（model-based method）

D. 带标签噪声的回归问题

回归问题的目标是建模特征和连续目标变量之间的关系（分类是离散的目标空间）

回归问题考虑考虑两种类型的标签噪声：

加性噪声（additive noise）： $\hat{y}:=y+\epsilon$
实例相关噪声（instance-dependent noise）： $\hat{y}:=\rho(x)$

尽管目标空间不同，但是分类和回归都是学习从特征空间到标签的映射关系，因此用于分类问题的方法很容易扩展到回归问题。本文重点关注分类问题。

3. 基于深度学习的方法

共分为五类，如fig.2和fig.3所示，分别为：

鲁棒结构设计：
鲁棒正则化方法：减少对假样本的过拟合
鲁棒损失函数设计
损失调整：包括损失校正、损失重加权、标签翻新（label refurbishment）和元学习
样本选择&

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。