数据增强
为什么需要数据增强
- 增加数据集的多样性,更好的匹配测试集。
- 可以理解为给训练集加一些噪音,让训练处的算法更具有鲁棒性。
常见的数据增强
一般数据增强都是在线生成,随机做增强。随机很重要。在线是在训练的时候随机对数据进行不同形式的增强。
翻转
- 上下翻转
- 左右翻转
但是不是总可行的。比如
切割
- 从图片中切割一块,然后变形到固定的形状
- 随机高宽比
- 随机大小
- 随机位置
颜色
- 改变色调,饱和度,明亮度
Code
import torch
import torchvision
from torch import nn
from d2l import torch as d2l
d2l.set_figsize()
img = d2l.Image.open('pig.jpg')
d2l.plt