版权声明:本文由 chaser 授权转载
https://zhuanlan.zhihu.com/p/76044027
更多论文解读的博客原文第一时间发布于我的github论文合集:
https://github.com/ming71/CV_PaperDaily
和个人博客:
https://ming71.github.io/
欢迎关注,有想法欢迎一起讨论!私信评论均可。
如有markdown语法知乎显示bug不进行修改维护,请直接移步github和博客即可。文章的维护也只在git和博客进行,知乎文章除有错误外不更新。
**顺便mark我的数据增强代码工具(持续更新)**:
toolbox:https://github.com/ming71/toolbox
论文发布日期:2019.6.1[Big Data]
1. Introduction
数据增强与过拟合
验证是否过拟合的方法:画出loss曲线,如果训练集loss持续减小但是验证集loss增大,就说明是过拟合了。
数据增强目的
通过数据增强实现数据更复杂的表征,从而减小验证集和训练集以及最终测试集的差距,让网络更好地学习迁移数据集上的数据分布。这也说明网络不是真正地理解数据,而是记忆数据分布。数据增强的方法
(1)数据变换增强
包括几何变换、色彩空间变换,随机擦除,对抗训练,神经风格迁移等
(2)重采样增强
主要侧重于新的实例合成。如图像混合(mixup),特征空间的增强,GAN生成图片。一张图看明白: