零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增

数据读取与扩增

上节学习了街景字符编码识别的解题思路,让我们对本赛题有了基本的idea,这节在定长字符编码的思路基础上学习读取数据和数据扩增。

图像数据读取

由于赛题数据是图像数据,赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作,在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。

pillow

Pillow是Python图像处理函式库(PIL)的一个分支。Pillow提供了常见的图像读取和处理的操作,而且可以与ipython notebook无缝集成,是应用比较广泛的库。
pillow的加载与图片数据的读取:

from PIL import Image
image = Image.open('20180425193352524.png')
image.show()

在这里插入图片描述

from PIL import Image
image = Image.open('20180425193352524.png')
image.rotate(45).show()

在这里插入图片描述

from PIL import Image, ImageFilter
 # 读取图像 
im = Image.open('20180425193352524.png')
 # 应用模糊滤镜:
im2 = im.filter(ImageFilter.BLUR)
 # 保存图像为jpeg格式,文件名为‘blur.jpg’
im2.save('blur.jpg', 'jpeg')

在这里插入图片描述

from PIL import Image
# 打开一个png图像文件,注意是当前路径:
im = Image.open('20180425193352524.png')
# 得到图像的宽和高
w = im.size[0]
h = im.size[1]
# 放缩图像
im.thumbnail((w//2, h//2))
im.show()
im.save('beauty2.jpg', 'jpeg')

在这里插入图片描述
当然上面只演示了Pillow最基础的操作,Pillow还有很多图像操作,是图像处理的必备库。Pillow的官方文档

OpenCV

OpenCV是一个跨平台的计算机视觉库,最早由Intel开源得来。OpenCV发展的非常早,拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加强大很多,学习成本也高很多。
OpenCV加载图像、显示图像、保存图像

# 导入Opencv库
import cv2
# 读取图像
img = cv2.imread('20180425193352524.png')
# Opencv默认颜色通道顺序是BRG,转换一下
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# 显示图像
cv2.namedWindow("Image")   
cv2.imshow("Image"
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值