1.Data Augmentation
1.1 简单的数据扩充
图像水平翻转
随机扣取
尺度变换和旋转
色彩抖动:在RGB颜色空间对原有RGB色彩分布进行轻微扰动
也可以在HSV空间随机改变图像原有的饱和度和明度
(改变S和V通道的值)
或对色调进行微调(小范围改变H的值)
1.2 特殊的数据扩充方式
1.2.1 Fancy PCA
- 对所有训练数据的R,G,B像素值进行PCA,得到对应特征向量 pi p i 和特征值 λi(i=1,2,3) λ i ( i = 1 , 2 , 3 )
- 根据特征向量和特征值计算一组随机值 [p1,p2,p3],[α1λ1,α2λ2,α3λ3]T [ p 1 , p 2 , p 3 ] , [ α 1 λ 1 , α 2 λ 2 , α 3 λ 3 ] T
- 将其作为扰动加到原像素值,其中 αi α i 为取自以0为均值,标准差为0.1的高斯分布的随机值
- 每经过一轮训练(1个epoch), αi α i 重新随机选取,重复上述操作进行扰动
5.2.2 监督式数据扩充
适用于高层语义图像分类任务
- 先训练一个初始分类模型
- 生成对应特征图/热力图:指示图像区域与场景标记间的相关概率。
- 可根据此概率映射回原图选择较强相关的图像区域进行图像扣取
6.数据预处理
中心式归一化(mean normalization)
CNN 中,计算训练集图像像素均值,在处理训练集,验证集和测试集图像时分别减去该均值。
原理:默认自然图像是一类平稳的数据分布,每个样本上减去数据的统计平均值(逐样本计算),移除共同部分
参考文献:解析卷积神经网络—深度学习实践手册