街景识别-数据读取与数据扩增

本文介绍了图像读取库Pillow和OpenCV,并详细讨论了深度学习中数据扩增的重要性,包括其作用、方法和常用库。在字符识别任务中,数据扩增能增加样本数量,缓解过拟合,提高模型泛化能力。常见的数据扩增方法如颜色变换、裁剪、旋转等,但在某些场景下需避免翻转操作,以免改变数据含义。最后,提到了torchvision、imgaug和albumentations等数据扩增库。
摘要由CSDN通过智能技术生成

一、学习目标

1.1 学习Python和Pytorch中图像读取
2.2 学会扩增方法和Pytorch读取赛题数据

二、图像读取

2.1 pillow

pillow是Python图像处理函数库(PIL)的一个分支。Pillow提供了常见的图像读取和处理的操作,而且可以和ipython notebook无缝集成,是应用比较广泛的库。
pillow官方文档.

2.2 OpenCV

OpenCV是一个跨平台的计算机视觉库,OpenCV发展的非常早,拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加强大很多,学习成本也高很多。
OpenCV有很多关于图像处理的操作,有专门的书籍讲解这部分,网上也有很多代码。OpenCV包含了你能想得到的只要与图像相关的操作。此外OpenCV还内置了很多的图像特征处理算法,如关键点检测、边缘检测和直线检测等。
OpenCV官网.

三、数据扩增

上面给大家初步介绍了Pillow和OpenCV的使用,现在回到赛题街道字符识别任务中。在赛题中我们需要对的图像进行字符识别,因此需要我们完成的数据的读取操作,同时也需要完成数据扩增(Data Augmentation)操作。

3.1.数据扩增介绍

在深度学习中数据扩增方法

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值