[Paper Note] Learning to Reweight Examples for Robust Deep Learning

最新推荐文章于 2024-05-08 09:43:56 发布

Jemary_

最新推荐文章于 2024-05-08 09:43:56 发布

阅读量4.8k

点赞数 5

CC 4.0 BY-SA版权

分类专栏： Paper Reading

本文链接：https://blog.csdn.net/Jemary_/article/details/103150912

本文提出了一种基于元学习的算法，用于在样本不平衡和标签噪声问题中重新加权训练样本，以实现更稳健的深度学习。通过对小规模干净验证集上的损失进行最小化，该方法避免了超参数调整，具有理论上的收敛保证，并已在MNIST和CIFAR数据集上的实验中表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Learning to Reweight Examples for Robust Deep Learning

PAPER
CODE

Abstract

面对样本不平衡问题和标签噪声等问题，之前是通过regularizers或者reweight算法，但是需要不断调整超参取得较好的效果。本文提出了meta-learning的算法，基于梯度方向调整权重。具体做法是需要保证获得一个足够干净的小样本数据集，每经过一轮batch大小的训练就基于当前更新的权重，执行meta gradient descent step来最小化在这个干净无偏差的验证集上的loss。这个方法避免了额外的超参调整，在样本不平衡和标签噪声等问题上可以有很好的效果，所需要的仅仅是一个很小数量的干净的验证集。

Related Work

在解决样本问题上的工作：

训练集样本权重分配：
AdaBoost：寻找难例来训练分类器。
难例挖掘：下采样多数样本，挖掘最难的样本
Focal Loss：不同样本添加不同权重，困难样本权重更大
outliers和noise processes：
有些方法是先学习简单样本在学习困难样本
部分工作是去研究如何更好地初始化网络参数
直接对样本数据集下手，re-sample之类的

在最近的meta-learning中，很多都在探索使用validation loss作为meta-objective，本文算法的区别是没有额外的超参，并且避免了成本较高的离线训练。

Learning to Reweight Examples

本文的模型看做online approximation而不是meta-learning objective，这样就可以处理任何常规的监督学习。
文章给出了具体实现并且有理论保证，收敛率为 $O\left(1 / \epsilon^{2}\right)$

3.1 From a meta-learning objective to online approximation

$(x, y)$ 为输入-标签对， $\left\{\left(x_{i}, y_{i}\right), 1 \leq i \leq N\right\}$ 为训练集，假设 $\left\{\left(x_{i}^{v}, y_{i}^{v}\right), 1 \leq i \leq M\right\}$ 为一个很小的干净无偏差的验证集，其中 $\ll N$ . $v$ 表示验证集， $i$ 表示第 $i^{th}$ 个数据；同时假设训练集是包含验证集的，如果不包含，就把验证集加入到训练集中，从而使得训练过程中能够利用更多信息。