图像数据读取与扩增

本文详细介绍了图像数据的读取,包括matplotlib、Pillow和OpenCV库的使用,并探讨了图像数据的扩增,解释了数据扩增在深度学习中的重要性以及常见方法,如颜色、尺寸、形态等变换。最后提供了实际操作的代码示例,强调了在字符识别任务中数据扩增的注意事项。
摘要由CSDN通过智能技术生成

一、图像数据的读取

1.matplotlib库

import matplotlib.pyplot as plt
img=plt.imread('.../1.png')
print(img.shape)
print(img.dtype)
print(type(img))
plt.imshow(img)
plt.show()

imread读取的图片为numpy.ndarry的数组,数组的大小排列为:高×宽×通道数,数组的类型是uint8,即每个数据的大小为[0,255]

2.pillow库

pillow库的概述

PIL库可以完成图像归档和图像处理两方面功能需求:

  • 图像归档:对图像进行批处理、生成图像预览、图像格式转换等;
  • 图像处理:图像基本处理、像素处理、颜色处理等。

读取图像及图像属性代码如下:

from PIL import Image
im=Image.open('.../1.png')
print(im.format) #图像格式
print(im.mode) #图像色彩模式
print(im.size) #宽度和高度

可以查看特定颜色的RGBA/RGB值

from PIL import ImageColor
print(ImageColor.getcolor('red','RGBA'))
print(ImageColor.getcolor('black','RGB'))

图像储存:

im.save('im.jpg',quality=95,subsampling=0)

其中quality是质量参数,1最差,95最好。subsampling参数通过实现色度信息的分辨率低于亮度信息来对图像进行编码的实践。 可能的子采样值是0,1和2,正常0可以满足图片大小增大的需求。

pillow库进行图像处理

图像裁剪:

cropedim=im.crop((150,10,500,300))
cropedim
#裁剪范围横坐标为(150,500),纵坐标为(10,300)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值