训练时增强
数据增强主要是为了满足多变的测试场景,翻转 flip / 裁剪crop / 变色(colorjittor) 是最常用的
- 工具:https://github.com/aleju/imgaug
- 自动的增强方法:Autoaugment: Learning augmentation strategies from data
- 把多种颜色变化通过参数的形式结合在一起:亮度、对比度、饱和度、色调 torchvision.transforms.colorjittor(brightness, contrast, saturation, hue)
测试时增强
- 如 imagenet 上 做的 图片正中间裁剪 (centor crop),把短边留下,长边裁剪到正方形,resize到224x224
- 测试时增强会增加开销。但比赛中可以用,例如多种随机crop
数据增强和数据分布
- 图片增强一般不改变数据分布,因为不改变每个类别的样本数量。
- 图片增强因为是随机的,所以可以看作是均值不变、方差变大
- 图片增强会带来数据量增加、数据多样性增加
- 训练和测试数据的分布要保持一致,不是指的pixel层面,一般是指的每个类别的样本数量,各种 shift (ics, domain shift 等等)