零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增

最新推荐文章于 2024-04-30 17:37:42 发布

VIP文章 Libaididi

最新推荐文章于 2024-04-30 17:37:42 发布

阅读量322

点赞数 2

分类专栏：图像数据读取和数据扩增文章标签：计算机视觉 python

本文链接：https://blog.csdn.net/libaididi/article/details/106253007

版权

数据读取与扩增

上节学习了街景字符编码识别的解题思路，让我们对本赛题有了基本的idea，这节在定长字符编码的思路基础上学习读取数据和数据扩增。

图像数据读取

由于赛题数据是图像数据，赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作，在Python中有很多库可以完成数据读取的操作，比较常见的有Pillow和OpenCV。

pillow

Pillow是Python图像处理函式库(PIL）的一个分支。Pillow提供了常见的图像读取和处理的操作，而且可以与ipython notebook无缝集成，是应用比较广泛的库。
pillow的加载与图片数据的读取：

from PIL import Image
image = Image.open('20180425193352524.png')
image.show()

在这里插入图片描述

from PIL import Image
image = Image.open('20180425193352524.png')
image.rotate(45).show()

在这里插入图片描述

from PIL import Image, ImageFilter
 # 读取图像 
im = Image.open('20180425193352524.png')
 # 应用模糊滤镜:
im2 = im.filter(ImageFilter.BLUR)
 # 保存图像为jpeg格式，文件名为‘blur.jpg’
im2.save('blur.jpg', 'jpeg')

在这里插入图片描述

from PIL import Image
# 打开一个png图像文件，注意是当前路径:
im = Image.open('20180425193352524.png')
# 得到图像的宽和高
w = im.size[0]
h = im.size[1]
# 放缩图像
im.thumbnail((w//2, h//2))
im.show()
im.save('beauty2.jpg', 'jpeg')

在这里插入图片描述
当然上面只演示了Pillow最基础的操作，Pillow还有很多图像操作，是图像处理的必备库。Pillow的官方文档。

OpenCV

OpenCV是一个跨平台的计算机视觉库，最早由Intel开源得来。OpenCV发展的非常早，拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加强大很多，学习成本也高很多。
OpenCV加载图像、显示图像、保存图像

# 导入Opencv库
import cv2
# 读取图像
img = cv2.imread('20180425193352524.png')
# Opencv默认颜色通道顺序是BRG，转换一下
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# 显示图像
cv2.namedWindow("Image")   
cv2.imshow("Image"

最低0.47元/天解锁文章

Libaididi

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增

数据读取与扩增上节学习了街景字符编码识别的解题思路，让我们对本赛题有了基本的idea，这节在定长字符编码的思路基础上学习读取数据和数据扩增。图像数据读取由于赛题数据是图像数据，赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作，在Python中有很多库可以完成数据读取的操作，比较常见的有Pillow和OpenCV。pillowPillow是Python图像处理函式库(PIL）的一个分支。Pillow提供了常见的图像读取和处理的操作，而且可以与ipython notebook无缝集成
复制链接

扫一扫