数据增强方法是指将数据集的数量增大十倍以上,从而极大化利用小样本集中的每个样本,使之也可以训练得到一个较好的模型。数据增强方法还可以提高模型的鲁棒性,防止其易在训练中出现过拟合的现象。
常用的数据增强方法有:
1.平移(Shift)变换:对原始图片在图像平面内以某种方式(预先定义或者随机方式确定平移的步长、范围及其方向)进行平移。
2.翻转(Flip)变换:沿竖直或者水平方向对原始图片进行翻转。
3.随机裁剪(Random Crop):随机定义感兴趣区域以裁剪图像,相当于增加随机扰动。
4.噪声扰动(Noise):对图像随机添加高斯噪声或者椒盐噪声等。
5.对比度变换(Contrast):改变图像对比度,相当于在HSV空间中,保持色调分量H不变,而改变亮度分量V和饱和度S,用于模拟现实环境的光照变化。
6.缩放变换(Zoom):以设定的比例缩小或者放大图像。
7.尺度变换(Scale):与缩放变换有点类似,不过尺度变换的对象是图像内容而非图像本身(可以参考SIFT特征提取方法),构建图像金字塔以得到不同大小、模糊程度的图像。
随着CNN体系结构具有更多的参数,使得传统的数据增强技术显得不足,促使着新的数据增强方法出现。
RICAP: Random Image