图像处理本地基本类库使用

本文介绍了Python中用于图像处理的PIL、OpenCV和matplotlib库的基本操作,包括读取、显示、保存图片,颜色空间转换,通道处理,图片翻转、旋转和平移等。同时,提到了颜色空间转换的数学原理和处理过程中的常见错误。
摘要由CSDN通过智能技术生成

课程连接
项目链接
参考项目(坑姐的图像处理入门基础)

在这里插入图片描述
图:1.jpg

PIL库

安装库

pip install pil

导入库

from PIL import Image

读取文件

img = Image.open('1.jpg')  # 使用pil库读取图片

显示图片

img.show()  # 显示图片

保存图片

img.save("1.1.jpg")  # 保存

转换为数组

np.array(img)

print(np.array(img).shape) # 太长了就不展示了直接看数组的维度吧
(121, 121, 3)

PIL分离颜色通道

img.getchannel(0)  # 括号里面0,1,2就是对应的通道
r, g, b = img.split()  #  r, g, b就是对应的通道

图片裁剪

r.crop((50, 50, 128, 128))   # 对应着4个点的像素坐标 

三通道的彩色图(RGB),还有四通道的(RGBA)
在这里插入图片描述

OpenCV库(cv2)

读取图片

img = cv2.imread('1.jpg', 3)  # 0,1,2代表对应的通道,3代表3通道

print(img.shape)
(121, 121, 3)

显示图片

cv2.imshow('image', img)  # 显示图片
cv2.waitKey(1500)  # 显示图片时长(单位毫秒)0则是一直显示

把维度进行 转换

img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # 将彩色图的BGR通道顺序转成RGB

OpenCV读取的BGR通道顺序其他的库是RGB通道顺序,需要进行修改(比如用plt显示)

通道分割

b, g, r = cv2.split(img)

g通道:
在这里插入图片描述

通道合并

img = cv2.merge((b, g, r))

大小缩放

img = cv2.resize(img, (400, 500))

翻转及旋转

参数2 = 0:垂直翻转(沿x轴),参数2 > 0: 水平翻转(沿y轴),参数2 < 0: 水平垂直翻转。

img = cv2.flip(img, 2, 2)

平移图片
要平移图片,我们需要定义下面这样一个矩阵,tx,ty是向x和y方向平移的距离:
在这里插入图片描述
平移是用仿射变换函数cv2.warpAffine()实现的:

rows, cols = img.shape[:2]  # 获得图片的高、宽
M = np.float32([[1, 0, 20], [0, 1, 40]])  # x轴平移20,y轴平移40
img = cv2.warpAffine(img, M, (cols, rows))  

划线:

# 画一条线宽为5的蓝色直线,参数2:起点,参数3:终点
cv2.line(img, (0, 0), (60, 120), (255, 255, 0), 5)  

在这里插入图片描述
画矩形:

img = cv2.rectangle(img, (40, 40), (80, 80), (0, 255, 0),2)

在这里插入图片描述

颜色空间转换

最常用的颜色空间转换如下:

  • RGB或BGR到灰度(COLOR_RGB2GRAY,COLOR_BGR2GRAY)
  • RGB或BGR到YcrCb(或YCC)(COLOR_RGB2YCrCb,COLOR_BGR2YCrCb)
  • RGB或BGR到HSV(COLOR_RGB2HSV,COLOR_BGR2HSV)
  • RGB或BGR到Luv(COLOR_RGB2Luv,COLOR_BGR2Luv)
  • 灰度到RGB或BGR(COLOR_GRAY2RGB,COLOR_GRAY2BGR)

经验之谈:颜色转换其实是数学运算,如灰度化最常用的是:gray=R0.299+G0.587+B*0.114。

特殊报错

在这里插入图片描述
如上图:是图片导入异常导致的请查看图片的路径

matplotlib库

导入

import matplotlib.pyplot as plt # plt 用于显示图片
import matplotlib.image as mpimg # mpimg 用于读取图片

读取文件

img = mpimg.imread('1.jpg')

显示文件

plt.imshow(img)
# plt.axis('off')  # 不显示坐标轴
plt.show()

在这里插入图片描述

显示某个通道

img_1 = img[:, :, 0]

这个是热度图
在这里插入图片描述

plt.imshow(img_1, cmap='Greys_r')  # 转换成灰度图

### 或者
img = plt.imshow(img_1)
img.set_cmap('gray')  # 'hot' 是热量图
plt.show()

在这里插入图片描述

对图像处理的几个类库进行了简单的解析。

这是opencv svm图像分类的整个工程代码,在VS2010下打开即可。整个工程文件以及我的所有训练的图片存放在这里,需要的可以下载,自己在找训练图片写代码花了很多时间,下载完后自行解压,训练图片和测试图片可以从这免费下载http://download.csdn.net/detail/always2015/8944959,project data文件夹直接放在D盘就行,里面存放训练的图片和待测试图片,以及训练过程中生成的中间文件,现在这个下载object_classfication_end则是工程文件,我用的是vs2010打开即可,下面工程里有几个要注意的地方: 1、在这个模块中使用到了c++的boost库,但是在这里有一个版本的限制。这个模块的代码只能在boost版本1.46以上使用,这个版本以下的就不能用了,直接运行就会出错,这是最需要注意的。因为在1.46版本以上中对比CsSVM这个类一些成员函数做了一些私有化的修改,所以在使用该类初始化对象时候需要注意。 2、我的模块所使用到的函数和产生的中间结果都是在一个categorizer类中声明的,由于不同的执行阶段中间结果有很多个,例如:训练图片聚类后所得到单词表矩阵,svm分类器的训练的结果等,中间结果的产生是相当耗时的,所以在刚开始就考虑到第一次运行时候把他以文件XML的格式保存下来,下次使用到的时候在读取。将一个矩阵存入文本的时候可以直接用输出流的方式将一个矩阵存入,但是读取时候如果用输入流直接一个矩阵变量的形式读取,那就肯定报错,因为输入流不支持直接对矩阵的操作,所以这时候只能对矩阵的元素一个一个进行读取了。 3、在测试的时候,如果输入的图片太小,或者全为黑色,当经过特征提取和单词构造完成使用svm进行分类时候会出现错误。经过调试代码,发现上述图片在生成该图片的单词的时候所得到的单词矩阵会是一个空矩阵,即该矩阵的行列数都为0,所以在使用svm分类器时候就出错。所以在使用每个输入图片的单词矩阵的时候先做一个判断,如果该矩阵行列数都为0,那么该图片直接跳过。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

三岁学编程

感谢支持,更好的作品会继续努力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值