数据读取与数据扩增
一、学习目标
1.1 学习Python和Pytorch中图像读取
2.2 学会扩增方法和Pytorch读取赛题数据
二、图像读取
2.1 pillow
pillow是Python图像处理函数库(PIL)的一个分支。Pillow提供了常见的图像读取和处理的操作,而且可以和ipython notebook无缝集成,是应用比较广泛的库。
pillow官方文档.
2.2 OpenCV
OpenCV是一个跨平台的计算机视觉库,OpenCV发展的非常早,拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加强大很多,学习成本也高很多。
OpenCV有很多关于图像处理的操作,有专门的书籍讲解这部分,网上也有很多代码。OpenCV包含了你能想得到的只要与图像相关的操作。此外OpenCV还内置了很多的图像特征处理算法,如关键点检测、边缘检测和直线检测等。
OpenCV官网.
三、数据扩增
上面给大家初步介绍了Pillow和OpenCV的使用,现在回到赛题街道字符识别任务中。在赛题中我们需要对的图像进行字符识别,因此需要我们完成的数据的读取操作,同时也需要完成数据扩增(Data Augmentation)操作。
3.1.数据扩增介绍
在深度学习中数据扩增方法