定长字符识别构建模型
3.数据读取与数据扩增
主要内容为数据读取、数据扩增方法和Pytorch读取赛提数据。
3.1 图像读取
提供数据为图像数据,目的是识别图像中的字符,应先对需要完成对数据的读取操作,常见的有Pillow和OpenCV.
3.1.1 Pillow
详细的基础操作可见:
https://www.liaoxuefeng.com/wiki/1016959663602400/1017785454949568
对应文档:https://pillow-cn.readthedocs.io/zh_CN/latest/
官网:https://pillow.readthedocs.io/en/stable/
Pillow是Python图像处理函式库(PIL)的一个分支,提供了常见的图像读取和处理的操作,如切片、旋转、滤镜、输出文字、调色板等,而且可以与ipython notebook无缝集成,是应用比较广泛的库。
from PIL import Image
# 导入Pillow库
# 读取图片
im =Image.open('./cat.png')
from PIL import Image, ImageFilter
im = Image.open('./cat.png')
# 应用模糊滤镜
im2 = im.filter(ImageFilte