【深度学习】Mixup: Beyond Empirical Risk Minimization

最新推荐文章于 2022-08-03 20:22:56 发布

z小白

最新推荐文章于 2022-08-03 20:22:56 发布

阅读量1w

点赞数 13

分类专栏：深度学习深度学习文章标签：深度学习 mixup ERM 数据增强

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzc15806/article/details/80696787

版权

本文介绍了深度学习中的Mixup数据增强技术，它是一种基于经验风险最小化（ERM）和邻域风险最小化（VRM）的扩展方法。Mixup通过线性插值创建训练样本的混合版本，提高模型的泛化能力。研究表明，这种方法可以显著提升模型的性能，且实现简单。文章还提供了Mixup的Python实现代码。

摘要由CSDN通过智能技术生成

博主整理了近几年混合样本数据增强（Mixed Sample Data Augmentation）相关论文和代码，并分享在github上，地址如下，

https://github.com/JasonZhang156/awesome-mixed-sample-data-augmentation

如果大家对混合样本数据增强算法有兴趣，可以star或者fork到自己的仓库。

博主会对内容持续更新！

一、相关理论

Mixup是MIT和FAIR在ICLR 2018上发表的文章中提到的一种数据增强算法。在介绍mixup之前，我们首先简单了解两个概念：经验风险最小化（Empirical risk minimization，ERM）和邻域风险最小化（Vicinal Risk Minimization，VRM）。

“经验风险最小化”是目前大多数网络优化都遵循的一个原则，即使用已知的经验数据（训练样本）训练得到的学习器的误差或风险，也叫作“经验误差”或“训练误差”。相对的，在新样本（未知样本）上的误差称为“泛化误差”，显然，我们希望学习器的“泛化误差”越小越好。然而，通常我们事先并不知道新样本是什么样的，实际能做的是努力使经验误差越小越好。但是，过分的减小经验误差，通常会在未知样本上产生很差的结果，也就是我们常说的“过拟合”。

关于“泛化性”，通常可以通过使用大规模训练数据来提高，但

最低0.47元/天解锁文章

关注

13
点赞
踩
27

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。