python图像处理opencv笔记（一）：图像基本操作

最新推荐文章于 2024-09-15 14:05:28 发布

submarineas

最新推荐文章于 2024-09-15 14:05:28 发布

阅读量760

点赞数 2

分类专栏： opencv 文章标签： opencv 计算机视觉 python

本文链接：https://blog.csdn.net/submarineas/article/details/108173445

版权

opencv 专栏收录该内容

13 篇文章 4 订阅

订阅专栏

图像基本操作

图像基本操作

opencv-python安装

目前如果不指定版本，默认都是安装opencv 4.2以上版本的简化版，安装方式如下：

pip install opencv-python
# 如果上面的安装失败，请添加阿里或者清华源
pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
# 阿里 http://mirrors.aliyun.com/pypi/simple

而如果还是出现http time out问题，请去python离线包的网站找whl文件。

一、图像读写操作

读取展示imread和imshow：

在opencv中，如果还是在用的3以下版本的opencv，可以会有这种语法：

import cv2.cv as cv

# 读图片
image=cv.LoadImage('img/image.png', cv.CV_LOAD_IMAGE_COLOR)# Load the image
#Or just: image=cv.LoadImage('img/image.png')

cv.NamedWindow('image', cv.CV_WINDOW_AUTOSIZE) # Facultative
cv.ShowImage('image', image) #Show the image

# 写图片
cv.SaveImage("test.png", test)
cv.WaitKey(0)

但在4版本以后，用imread、imwrite和imshow替换了上面的语法：

import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline 
"""
%pylab inline 
# 这是使用了 `inline` 作为 matplotlib 的后端，
# 简单来说，就是简化代码，方面我们用最少的代码来在jupyter上画图
"""

img=cv2.imread(r'./1200/picture4.jpg')

imread第一个参数为读取图片路径，第二个参数为读入类型：

cv2.IMREAD_COLOR：彩色图像，默认参数，忽略alpha通道
cv2.IMREAD_GRAYSCALE：灰度图片
cv2.IMREAD_UNCHANGED：读入完整图片，包括alpha通道

图片展示：

#图像的显示,也可以创建多个窗口
cv2.imshow('image',img) 
# 等待时间，毫秒级，0表示任意键终止
cv2.waitKey(0) 
cv2.destroyAllWindows()

# 函数式
def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

如果我们不想手动进行waitKey关闭，可以设置时间为3000，转换一下就是3S，另外还可以cv2.destroyWindow(wname)销毁指定窗口。
在这里插入图片描述

图片写入imwrite：

这里我们可以结合上面的两个函数写一个完整程序：

import numpy as np
import cv2

img = cv2.imread('33.jpg')
cv2.imshow('image',img)
k = cv2.waitKey(0)
if k == 27:         # wait for ESC key to exit
    cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv2.imwrite('messigray.png',img)
    cv2.destroyAllWindows()

cv2.imwrite(file，img，num)第一个参数是要保存的文件名，第二个参数是要保存的图像。可选的是第三个参数：

JPEG，参数为CV_IMWRITE_JPEG_QUALITY，它的值是从0到100，值越小压缩的越多，默认值是95.
PNG，参数为CV_IMWRITE_PNG_COMPRESSION,它的值是从0到9，值越大表示图片尺寸越小，压缩时间越长。默认值是3。
PPM，PGM或者PBM，参数为CV_IMWRITE_PXM_BINARY，它的值是0或者1。默认值是1。

其中cv2.IMWRITE_JPEG_QUALITY类型为 long ,必须转换成 int，其中png我试验是一张1M多的灰度图，选择1到9的差别，可以到300多k左右，而为什么不选jpeg或者更详细的说明见如下：

参数filename为所需保存图像的文件目录和文件名。这里的文件名需要带有图像格式后缀的，目前OpenCV该函数只支持JPEG,PNG,PPM,PGM,PBM，TIFF等。并不是所有Mat类型都支持。

img参数为图像数据来源，其类型为Mat。注意也不是所有格式的Mat型数据都能被使用保存为图片，目前OpenCV主要只支持单通道和3通道的图像，并且此时要求其深度为8bit和16bit无符号(即CV_16U)。所以其他一些数据类型是不支持的，比如说float型等。如果Mat类型数据的深度和通道数不满足上面的要求，则需要使用convertTo()函数和cvtColor()函数来进行转换。convertTo()函数负责转换数据类型不同的Mat，即可以将类似float型的Mat转换到imwrite()函数能够接受的类型。而cvtColor()函数是负责转换不同通道的Mat，因为该函数的第4个参数就可以设置目的Mat数据的通道数（只是我们一般没有用到它，一般情况下这个函数是用来进行色彩空间转换的）。另外也可以不用imwrite()函数来存图片数据，可以直接用通用的XML IO接口函数将数据存在XML或者YXML中。

图像数据读取与转换操作

截取部分图像数据：

img=cv2.imread('./1200/33.jpg')
image=img[0:50,0:200] 
cv_show('image',image)

在这里插入图片描述

展示RGB的三种图像：

import matplotlib.pyplot as plt
b,g,r=cv2.split(img)
plt.subplot(231), plt.imshow(b, 'gray'), plt.title('B')
plt.subplot(232), plt.imshow(g, 'gray'), plt.title('G')
plt.subplot(233), plt.imshow(r, 'gray'), plt.title('R')

plt.show()

在这里插入图片描述
而使用完split后，如果想将三个单一通道聚合，可以使用img = cv2.merge((b,g,r))便能回到3信道，这里就不展示了。

图像深浅复制：

不同于python的copy模块，python中浅复制是object.copy()、List[:]，而深拷贝是object.deepcopy()，opencv中调用的是numpy中的copy，这本身就是一种深拷贝，而直接赋值是浅拷贝：

import numpy as np
a = np.arange(12) # a为一个序列
b = a 
print('a shape：', a.shape)  
print('compare:', b is a)  
b.shape = 3, 4 
print('a shape：', a.shape) 

"""
a shape： (12,)
compare True
a shape： (3, 4)
"""

而如果是深拷贝，结果应该为：

a = np.arange(12)
d = a.copy()
print('compare：', d is a)
print('d是a嘛：', d.base is a)

"""
compare： False
d是a嘛： False
"""

图像基础运算与融合

边界填充

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

在这里插入图片描述

边界填充是我们要在原有图像上进行扩充的区域选择，具体的五种填充模式可以根据业务和所需要面积进行，另外详细的解释如下：

BORDER_REPLICATE：复制法，也就是复制最边缘像素。
BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
BORDER_WRAP：外包装法cdefgh|abcdefgh|abcdefg
BORDER_CONSTANT：常量法，常数值填充。

数值计算

img1=cv2.imread('./1200/picture22.jpg')
img2=cv2.imread('./1200/picture4.jpg')

img_1= img1 +10 
img1[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""

img_1[:5,:,0]
"""
array([[9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9]], dtype=uint8)
"""

#相当于% 256
(img_1 + img1)[:5,:,0] 
"""
array([[8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8]], dtype=uint8)
"""

cv2.add(img1,img_1)[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""

从上面的加减乘除中我们可以看到，除了%取余，其它都不会再进行进位，因为255是最高像素，所以大部分像素点会停留在255上不再改变。

图像融合

如果是需要两张图片相加，那么他们的信道数还有通道比一定要相同，否则会报错。

然后我们可以先对图片resize后再融合，resize的用法将在下一篇视频基本操作中总结，这里直接引出结果：

img1 = cv2.resize(img_dog, (500, 500))
img1.shape

img2 = cv2.resize(img_cat,(500,500))
img2.shape

在这里插入图片描述

submarineas

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录