数据读取
1、学习Python和Pytorch进行图像读取
python中常见读取图像的库有Pillow和OpenCV
文档中介绍Pillow的导入以及过滤提取,而OpenCV比Pillow更强大,但是所花费的学习成本较高,可以利用其内置的算法函数对图像进行大部分操作,并且内置很多图像特征处理算法,丰富且实用性高。
数据扩增
数据扩增:从字面上理解就是对数据量进行加大。
个人体会:数据扩增的基本方法就是对图像的基本特征进行变化,但该特征不能影响目标的标签,增加的数据量可以减小在学习过程中该特征的影响。
常见数据扩增的方法:从图像颜色、尺寸、形态、空间和像素等角度进行变换。同样不同方法可以组合。常用的数据扩增库有torchvision、imgaug、albumentations。
Pytorch读取数据
个人理解:文档主要介绍了Dataset和Dataloader:
1、Dataset:对数据集的封装,利用索引进行读取(类似逐个或切片读取)
2、DataLoader:类似定义了函数,以定义的方法进行迭代读取