Manifold Mixup 摘要速览

最新推荐文章于 2024-04-18 09:38:44 发布

FocusOneThread

最新推荐文章于 2024-04-18 09:38:44 发布

阅读量2.2k

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/guotong1988/article/details/104754578

版权

深度学习专栏收录该内容

212 篇文章 5 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

Manifold Mixup是一种深度学习正则化技术，通过在隐藏层进行特征插值，促进模型学习更平滑的决策边界，提高对数据分布偏移、异类和对抗样本的鲁棒性。实验表明，这种方法能提升模型的泛化能力和对抗攻击的抵抗力。

摘要由CSDN通过智能技术生成

Manifold Mixup: Better Representations by Interpolating Hidden States
https://arxiv.org/pdf/1806.05236.pdf
https://github.com/vikasverma1077/manifold_mixup

深度学习善于拟合训练数据，在测试数据分布稍有差异时，预测效果就不好，
这种测试数据包括数据分布偏移, 异类, 对抗样本，
为解决这个问题，我们提出Manifold Mixup，即一种简单的正则化方法，
Manifold Mixup使用语义插补文字作为附加的训练信号，使神经网络在多层的向量表示有更平滑的决策边界，
结果是，用Manifold Mixup训练的神经网络可学习class-representations时使用更少的方差方向，
我们证明了这个理论在理想情况下为何会发生扁平化，在实际场景也证实了，以及联系到之前的信息论和泛化理论，
尽管只用很少代码，Manifold Mixup很大提升了监督学习的baseline，提升了一步对抗样本攻击的鲁棒性，以及提升了测试集的log-likelihood分数