CV基础-数据读取与数据扩增

本文介绍了计算机视觉中数据读取的重要性和常用库,包括Pillow和OpenCV的基础操作。接着,讨论了数据扩增的作用,如缓解过拟合,增强模型泛化能力,并列举了多种数据扩增方法,如随机裁剪、翻转、旋转等。最后,提到了Pytorch中数据扩增的实现,并推荐了torchvision、imgaug和albumentations等库。
摘要由CSDN通过智能技术生成

定长字符识别构建模型

3.数据读取与数据扩增

主要内容为数据读取、数据扩增方法和Pytorch读取赛提数据。

3.1 图像读取

提供数据为图像数据,目的是识别图像中的字符,应先对需要完成对数据的读取操作,常见的有Pillow和OpenCV.

3.1.1 Pillow

详细的基础操作可见:
https://www.liaoxuefeng.com/wiki/1016959663602400/1017785454949568
对应文档:https://pillow-cn.readthedocs.io/zh_CN/latest/
官网:https://pillow.readthedocs.io/en/stable/
Pillow是Python图像处理函式库(PIL)的一个分支,提供了常见的图像读取和处理的操作,如切片、旋转、滤镜、输出文字、调色板等,而且可以与ipython notebook无缝集成,是应用比较广泛的库。

from PIL import Image
# 导入Pillow库
# 读取图片
im =Image.open('./cat.png')	

在这里插入图片描述

from PIL import Image, ImageFilter
im = Image.open('./cat.png')
# 应用模糊滤镜
im2 = im.filter(ImageFilte
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值