入门CV-Task2:数据读取与数据扩增
一:图像读取:
在python中有很多库可用于图像读取,如Pillow和Opencv
Pillow学习链接:https://pillow.readthedocs.io/en/stable/
Opencv学习链接:https://opencv.org/
二。数据扩增方法:
数据扩增:在深度学习中通过数据扩增增加训练集的样本,也可有效缓解模型过拟合的情况。
扩增方法有很多:从颜色空间、尺度空间到样本空间,根据不同任务数据扩增都有相应的区别。
对于图像分类,数据扩增一般不会改变标签。
对于物体检测,数据扩增会改变物体坐标位置。
对于图像分割,数据扩增会改变像素标签。
以torchvision为例,常见的扩充方法有:
transforms.CentreCrop 对图像中心进行裁剪
transforms.ColorJitter 对图像颜色的对比度,饱和度和零度进行变换。
transforms.FiveCrop 对图像中心和四个角进行裁剪得到五分图像。
transforms.Grayscale 对图像进行灰度变换
transforms.Pad 使用固定值进行像素填充
transforms.RandomAffine 随机仿射变换
transforms.RandomCrop随机区域裁剪
transforms.RandomHorizontalFilp随机水平翻转
transforms.RandomRotation随机旋转
transforms.RandomVerticalFilp 随机垂直翻转