街景识别-数据读取与数据扩增

最新推荐文章于 2022-11-07 21:49:49 发布

secker123

最新推荐文章于 2022-11-07 21:49:49 发布

阅读量1k

点赞数

分类专栏：街景识别文章标签：深度学习

本文链接：https://blog.csdn.net/secker123/article/details/106305001

版权

本文介绍了图像读取库Pillow和OpenCV，并详细讨论了深度学习中数据扩增的重要性，包括其作用、方法和常用库。在字符识别任务中，数据扩增能增加样本数量，缓解过拟合，提高模型泛化能力。常见的数据扩增方法如颜色变换、裁剪、旋转等，但在某些场景下需避免翻转操作，以免改变数据含义。最后，提到了torchvision、imgaug和albumentations等数据扩增库。

摘要由CSDN通过智能技术生成

一、学习目标

1.1 学习Python和Pytorch中图像读取
2.2 学会扩增方法和Pytorch读取赛题数据

二、图像读取

2.1 pillow

pillow是Python图像处理函数库（PIL）的一个分支。Pillow提供了常见的图像读取和处理的操作，而且可以和ipython notebook无缝集成，是应用比较广泛的库。
pillow官方文档.

2.2 OpenCV

OpenCV是一个跨平台的计算机视觉库，OpenCV发展的非常早，拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加强大很多，学习成本也高很多。
OpenCV有很多关于图像处理的操作，有专门的书籍讲解这部分，网上也有很多代码。OpenCV包含了你能想得到的只要与图像相关的操作。此外OpenCV还内置了很多的图像特征处理算法，如关键点检测、边缘检测和直线检测等。
OpenCV官网.

三、数据扩增

上面给大家初步介绍了Pillow和OpenCV的使用，现在回到赛题街道字符识别任务中。在赛题中我们需要对的图像进行字符识别，因此需要我们完成的数据的读取操作，同时也需要完成数据扩增（Data Augmentation）操作。

3.1.数据扩增介绍

在深度学习中数据扩增方法

最低0.47元/天解锁文章

secker123

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
街景识别-数据读取与数据扩增

数据读取与数据扩增一、学习目标二、图像读取2.1 pillow2.2 OpenCV三、数据扩增四 Pytorch赛题读取一、学习目标1.1 学习Python和Pytorch中图像读取2.2 学会扩增方法和Pytorch读取赛题数据二、图像读取2.1 pillowpillow是Python图像处理函数库（PIL）的一个分支。Pillow提供了常见的图像读取和处理的操作，而且可以和ipython notebook无缝集成，是应用比较广泛的库。pillow官方文档.2.2 OpenCVOpenC
复制链接

扫一扫