题目:Knockoffs-SPR: Clean Sample Selection in Learning With Noisy Labels
Knockoff SPR:带噪声标签学习中的干净样本选择
作者:Yikai Wang; Yanwei Fu; Xinwei Sun
源码链接: https://github.com/YikaiWang/Knockoffs-SPR
摘要
噪声训练集通常会导致神经网络的泛化和鲁棒性下降。在本文中,我们提出了一个新的理论保证的清洁样本选择框架,用于噪声标签的学习。具体来说,我们首先提出了一种可扩展的惩罚回归(SPR)方法,用于模拟网络特征和独热标签之间的线性关系。在SPR中,通过回归模型中解决的零均值偏移参数来识别清洁数据。我们理论上展示了在某些条件下SPR可以恢复清洁数据。在一般情况下,这些条件可能不再满足;一些噪声数据可能被错误地选为清洁数据。为了解决这个问题,我们提出了一种数据自适应方法,即带有Knockoff过滤器的可扩展惩罚回归(Knockoffs-SPR),它可以在选定的清洁数据中控制误选率(FSR)。为了提高效率,我们进一步提出了一种分割算法,将整个训练集划分为可以并行解决的小