Opencv图像处理学习笔记——图像-视频的基本操作

周六日不上发条

已于 2023-07-05 17:02:12 修改

阅读量162

点赞数

文章标签： opencv 图像处理学习

于 2023-07-03 20:59:54 首次发布

本文链接：https://blog.csdn.net/qq_44707977/article/details/131523531

版权

一、图像-视频的基本操作

图像是由一个个像素值组成，像素值的范围为[0,255]，数值越大代表越亮，0为黑，255为白。

每个小区域分别在R、G、B图像的颜色通道分别对应了一个值，灰度图只有一个通道。

import cv2                       #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 


img=cv2.imread('A.jpg')


输出结果：
array([[[142, 151, 160],
        [146, 155, 164],
        [151, 160, 169],
        ...,
        
       [[162, 186, 198],
        [157, 181, 193],
        [142, 166, 178],
      
        ...,
        [185, 198, 200],
        [130, 143, 145],
        [129, 142, 144]]], dtype=uint8)

dytpe=uint8，就是对于一个图像来说像素值的范围为[0,255]。对于矩阵来说当中的值分别对应于[h,w,c]来表示它的三个维度。

注：Opencv工具包读取图像的默认格式为BGR

读取图像，并对图像进行窗口显示

cv2.imshow('image',img)        # 窗口名称，窗口显示的图像

#0表示任意键终止，即不让他自己消失，而是自己按按钮消失，如果为100，则表示100ms后自动消失
cv2.waitKey(0)   
              
cv2.destroyAllWindows()        #关闭所有窗口


输出结果：

即：桌面显示所读取的那张图片

-----------------------------------------------------------------------------------------
定义函数达到同样效果方便使用：

def cv_show(name,img):        # 定义一个函数，方便后面调用
    cv2.imshow(name,img)      # 窗口名称，窗口显示的图像
    cv2.waitKey(0)            # 显示图像的时间，单位ms，0表示任意键终止
    cv2.destroyAllWindows()   # 关闭所有窗口


执行：
img.shape       # 图像的形状，返回值是一个包含行数，列数，通道数的元组

输出结果：

(414, 500, 3)

(414, 500, 3)分别对应于(h,w,c)。其中C为3表示B，G，R三通道。

如果想让读取的图像变成灰度图，将

img=cv2.imread('cat.jpg') 替换为

img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)

其中：

cv2.IMREAD_COLOR：彩色图像

cv2.IMREAD_GRAYSCALE：灰度图像

# 保存图像，第一个参数是保存的路径及文件名，第二个图像是要保存的图像
cv2.imwrite('mycat.png',img)  

 
# 图像的类型
type(img)        

# 图像的大小，返回值是图像的像素数目 
img.size 



# 图像的数据类型  
img.dtype

cv2.VideoCapture可以捕获摄像头，用数字来控制不同的设备，例如0,1。
如果是视频文件，直接指定好路径即可。

vc = cv2.VideoCapture('test.mp4')


# 检查是否打开正确
if vc.isOpened():            # 判断是否正常打开
    oepn, frame = vc.read()  # 读取视频第一帧,open是bool值，frame是第一帧的图像
else:                        # 如果没有正常打开，打印出错误信息
    open = False   


#接着遍历每一帧，组成一个视频

while open:                  # 循环读取视频帧
    ret, frame = vc.read()   # ret是bool值，frame是每一帧的图像
    if frame is None:        # 如果没有读取到图像，跳出循环
        break   
    if ret == True:          # 如果读取到图像，显示图像
        gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY) # 转换成灰度图
        cv2.imshow('result', gray)                      # 显示图像
        if cv2.waitKey(100) & 0xFF == 27:   # 每隔100ms判断是否按下了‘ESC’，如果按下了，退出循环
            break
vc.release()                                            # 释放资源
cv2.destroyAllWindows()                                 # 关闭窗口

ROI 区域

对一个图像中的某一感兴趣的区域进行截取

#截取图像感兴趣区域

img=cv2.imread('cat.jpg')       # 读取图像
cat=img[0:200,0:200]            # 截取图像的一部分
cv_show('cat',cat)              # 显示图像



------------------------------------------------------------------------------------
#  0   1   2
#  B   G   R


# 只保留R,将B和G通道全部置为0

cur_img = img.copy()    # 复制图像
cur_img[:,:,0] = 0      # 将B通道全部置为0
cur_img[:,:,1] = 0      # 将G通道全部置为0
cv_show('R',cur_img)    # 显示图像


# 只保留G,将B和R通道全部置为0

cur_img = img.copy()     # 复制图像
cur_img[:,:,0] = 0       # 将B通道全部置为0
cur_img[:,:,2] = 0       # 将R通道全部置为0
cv_show('G',cur_img)     # 显示图像 


# 只保留B,将G和R通道全部置为0

cur_img = img.copy()    # 复制图像
cur_img[:,:,1] = 0      # 将G通道全部置为0
cur_img[:,:,2] = 0      # 将R通道全部置为0
cv_show('B',cur_img)    # 显示图像

边界填充

对于一个图像的上下左右都要进行填充。

top_size,bottom_size,left_size,right_size = (50,50,50,50)   # 对图像进行边界扩充的像素数目

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)   # 指定边界扩充的方式，这里是复制法，将边界的像素复制到边界扩充的区域，
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)



----------------------------------------------------------------------------

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

BORDER_REPLICATE：复制法，也就是复制最边缘像素。
BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
BORDER_WRAP：外包装法cdefgh|abcdefgh|abcdefg
BORDER_CONSTANT：常量法，常数值填充。

数值计算


#数值计算
img_cat=cv2.imread('cat.jpg')     # 读取图像
img_dog=cv2.imread('dog.jpg')     # 读取图像

img_cat2= img_cat +10             # 图像的加法，每个像素都加10
img_cat[:5,:,0]                   # 查看图像的前5行的B通道的值


#输出结果

array([[142, 146, 151, ..., 156, 155, 154],
       [107, 112, 117, ..., 155, 154, 153],
       [108, 112, 118, ..., 154, 153, 152],
       [139, 143, 148, ..., 156, 155, 154],
       [153, 158, 163, ..., 160, 159, 158]], dtype=uint8)


img_cat2[:5,:,0]                  # 查看图像的前5行的B通道的值


#输出结果

array([[152, 156, 161, ..., 166, 165, 164],
       [117, 122, 127, ..., 165, 164, 163],
       [118, 122, 128, ..., 164, 163, 162],
       [149, 153, 158, ..., 166, 165, 164],
       [163, 168, 173, ..., 170, 169, 168]], dtype=uint8)



#相当于% 256

(img_cat + img_cat2)[:5,:,0]    # 查看图像的前5行的B通道的值


#输出结果

array([[ 38,  46,  56, ...,  66,  64,  62],    
       [224, 234, 244, ...,  64,  62,  60],
       [226, 234, 246, ...,  62,  60,  58],
       [ 32,  40,  50, ...,  66,  64,  62],
       [ 60,  70,  80, ...,  74,  72,  70]], dtype=uint8)


cv2.add(img_cat,img_cat2)[:5,:,0]   # 查看图像的前5行的B通道的值

#输出结果

array([[255, 255, 255, ..., 255, 255, 255],
       [224, 234, 244, ..., 255, 255, 255],
       [226, 234, 246, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)

注：对于(img_cat + img_cat2)[:5,:,0]输出结果中的38，为142+152=294-256=38，因为越界了，故给出溢出值。

对于cv2.add(img_cat,img_cat2)[:5,:,0]的加法，溢出了则为255，不溢出则为原始值。

图像融合

#图像融合

img_cat + img_dog   # 图像的加法，每个像素相加，如果超过255，就取255

img_cat.shape     # 查看图像的大小



img_dog = cv2.resize(img_dog, (500, 414))   # 将图像的大小调整为和猫的图像大小一致
img_dog.shape                               # 查看图像的大小


res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)    # 图像的融合，第一个参数是第一张图像，第二个参数是第一张图像的权重，第三个参数是第二张图像，第四个参数是第二张图像的权重，第五个参数是gamma值


plt.imshow(res)  # 显示图像



res = cv2.resize(img, (0, 0), fx=4, fy=4)   # 图像的缩放，第一个参数是原图像，第二个参数是缩放后的图像大小，第三个参数是沿x轴的缩放比例，第四个参数是沿y轴的缩放比例
plt.imshow(res) # 显示图像



res = cv2.resize(img, (0, 0), fx=1, fy=3)   # 图像的缩放，第一个参数是原图像，第二个参数是缩放后的图像大小，第三个参数是沿x轴的缩放比例，第四个参数是沿y轴的缩放比例
plt.imshow(res)                             # 显示图像