数据读取与数据扩增
1.数据读取
图像数据通常使用Pillow和OpenCV:
2.数据扩增
数据扩增可以增加训练集的样本,缓解过拟合情况也可以给模型带来更强的泛化能力。
数据扩增的方法:
本次比赛的图像数据不能进行翻转,数字一旦翻转就改变了原本的含义。
常用数据扩增库:torchvision,imgaug,albumentations
3.pytorch数据读取
在Pytorch中数据是通过Dataset进行封装,并通过DataLoder进行并行读取。
Dataset:对数据集的封装,提供索引方式的对数据样本进行读取
DataLoder:对Dataset进行封装,提供批量读取的迭代读取