数据增强也叫做数据扩增,就是在不实质上增加原始数据量的情况下,通过裁剪、旋转、缩放、对称等操作,在原有数据上产生更多的等价数据量作为深度学习的数据集。比如裁剪:对于一张256*256的图,裁剪成224*224的图片,可以产生32*32张不同的图片,数据量近似扩充了1000倍(实际情况可能因为图片相似度过高,打些折扣),如果再辅以其他手段,就会有更好的多样性。
数据增强可以分为:有监督的数据增强(又分为单样本和多样本的数据增强方法)和无监督的数据增强(分为生成新的数据和学习增强策略两个方向)。
一、有监督的数据增强
(1)有监督的数据增强,即需要有特定的数据变换规则,对于单样本,可以进行:几何变换类,如翻转(水平、垂直)、旋转(随机)、裁剪(随机)、变形、缩放等操作;颜色变换类,如噪声、模糊、颜色扰动、擦除、填充等。
需要注意的是:1)对于翻转和旋转操作,经常用于对方向不敏感的任务,比如图像分类。裁剪会改变图片的大小,缩放变形会使图片失真。2)通常情况下,网络的训练要求输入的大小固定,当数据集中的图像大小不一时,可以选择裁剪或缩放至网络要求的固定大小的方式,后者因为有失真,效果通常会比前者差。
基于噪声的数据增强就是在原来的图片基础上,随机叠加一些噪声,常用的如高斯噪声,也可以在面积大小选定、位置随机的矩形区域上去除像素产生黑色矩形框,从而产生一些彩色噪声,以Coarse Dropout方法