Opencv图像处理学习笔记——图像-视频的基本操作

一、图像-视频的基本操作

        图像是由一个个像素值组成,像素值的范围为[0,255]数值越大代表越亮,0为黑,255为白。

        每个小区域分别在R、G、B图像的颜色通道分别对应了一个值,灰度图只有一个通道。

import cv2                       #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 


img=cv2.imread('A.jpg')


输出结果:
array([[[142, 151, 160],
        [146, 155, 164],
        [151, 160, 169],
        ...,
        
       [[162, 186, 198],
        [157, 181, 193],
        [142, 166, 178],
      
        ...,
        [185, 198, 200],
        [130, 143, 145],
        [129, 142, 144]]], dtype=uint8)

       dytpe=uint8,就是对于一个图像来说像素值的范围为[0,255]。对于矩阵来说当中的值分别对应于[h,w,c]来表示它的三个维度。

        注:Opencv工具包读取图像的默认格式为BGR

读取图像,并对图像进行窗口显示

cv2.imshow('image',img)        # 窗口名称,窗口显示的图像

#0表示任意键终止,即不让他自己消失,而是自己按按钮消失,如果为100,则表示100ms后自动消失
cv2.waitKey(0)   
              
cv2.destroyAllWindows()        #关闭所有窗口


输出结果:

即:桌面显示所读取的那张图片

-----------------------------------------------------------------------------------------
定义函数达到同样效果方便使用:

def cv_show(name,img):        # 定义一个函数,方便后面调用
    cv2.imshow(name,img)      # 窗口名称,窗口显示的图像
    cv2.waitKey(0)            # 显示图像的时间,单位ms,0表示任意键终止
    cv2.destroyAllWindows()   # 关闭所有窗口


执行:
img.shape       # 图像的形状,返回值是一个包含行数,列数,通道数的元组

输出结果:

(414, 500, 3)

         (414, 500, 3)分别对应于(h,w,c)。其中C为3表示B,G,R三通道。

         如果想让读取的图像变成灰度图,将

         img=cv2.imread('cat.jpg')           替换为

         img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)

其中:

         cv2.IMREAD_COLOR:彩色图像

         cv2.IMREAD_GRAYSCALE:灰度图像

# 保存图像,第一个参数是保存的路径及文件名,第二个图像是要保存的图像
cv2.imwrite('mycat.png',img)  

 
# 图像的类型
type(img)        

# 图像的大小,返回值是图像的像素数目 
img.size 



# 图像的数据类型  
img.dtype                            

  • cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0,1。

  • 如果是视频文件,直接指定好路径即可。

vc = cv2.VideoCapture('test.mp4')


# 检查是否打开正确
if vc.isOpened():            # 判断是否正常打开
    oepn, frame = vc.read()  # 读取视频第一帧,open是bool值,frame是第一帧的图像
else:                        # 如果没有正常打开,打印出错误信息
    open = False   


#接着遍历每一帧,组成一个视频

while open:                  # 循环读取视频帧
    ret, frame = vc.read()   # ret是bool值,frame是每一帧的图像
    if frame is None:        # 如果没有读取到图像,跳出循环
        break   
    if ret == True:          # 如果读取到图像,显示图像
        gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY) # 转换成灰度图
        cv2.imshow('result', gray)                      # 显示图像
        if cv2.waitKey(100) & 0xFF == 27:   # 每隔100ms判断是否按下了‘ESC’,如果按下了,退出循环
            break
vc.release()                                            # 释放资源
cv2.destroyAllWindows()                                 # 关闭窗口


ROI 区域 

     对一个图像中的某一感兴趣的区域进行截取

#截取图像感兴趣区域

img=cv2.imread('cat.jpg')       # 读取图像
cat=img[0:200,0:200]            # 截取图像的一部分
cv_show('cat',cat)              # 显示图像



------------------------------------------------------------------------------------
#  0   1   2
#  B   G   R


# 只保留R,将B和G通道全部置为0

cur_img = img.copy()    # 复制图像
cur_img[:,:,0] = 0      # 将B通道全部置为0
cur_img[:,:,1] = 0      # 将G通道全部置为0
cv_show('R',cur_img)    # 显示图像


# 只保留G,将B和R通道全部置为0

cur_img = img.copy()     # 复制图像
cur_img[:,:,0] = 0       # 将B通道全部置为0
cur_img[:,:,2] = 0       # 将R通道全部置为0
cv_show('G',cur_img)     # 显示图像 


# 只保留B,将G和R通道全部置为0

cur_img = img.copy()    # 复制图像
cur_img[:,:,1] = 0      # 将G通道全部置为0
cur_img[:,:,2] = 0      # 将R通道全部置为0
cv_show('B',cur_img)    # 显示图像


  •  边界填充

        对于一个图像的上下左右都要进行填充。

top_size,bottom_size,left_size,right_size = (50,50,50,50)   # 对图像进行边界扩充的像素数目

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)   # 指定边界扩充的方式,这里是复制法,将边界的像素复制到边界扩充的区域,
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)



----------------------------------------------------------------------------

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

 

 

  • BORDER_REPLICATE:复制法,也就是复制最边缘像素。
  • BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb  
  • BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
  • BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg  
  • BORDER_CONSTANT:常量法,常数值填充。

数值计算 


#数值计算
img_cat=cv2.imread('cat.jpg')     # 读取图像
img_dog=cv2.imread('dog.jpg')     # 读取图像

img_cat2= img_cat +10             # 图像的加法,每个像素都加10
img_cat[:5,:,0]                   # 查看图像的前5行的B通道的值


#输出结果

array([[142, 146, 151, ..., 156, 155, 154],
       [107, 112, 117, ..., 155, 154, 153],
       [108, 112, 118, ..., 154, 153, 152],
       [139, 143, 148, ..., 156, 155, 154],
       [153, 158, 163, ..., 160, 159, 158]], dtype=uint8)


img_cat2[:5,:,0]                  # 查看图像的前5行的B通道的值


#输出结果

array([[152, 156, 161, ..., 166, 165, 164],
       [117, 122, 127, ..., 165, 164, 163],
       [118, 122, 128, ..., 164, 163, 162],
       [149, 153, 158, ..., 166, 165, 164],
       [163, 168, 173, ..., 170, 169, 168]], dtype=uint8)



#相当于% 256

(img_cat + img_cat2)[:5,:,0]    # 查看图像的前5行的B通道的值


#输出结果

array([[ 38,  46,  56, ...,  66,  64,  62],    
       [224, 234, 244, ...,  64,  62,  60],
       [226, 234, 246, ...,  62,  60,  58],
       [ 32,  40,  50, ...,  66,  64,  62],
       [ 60,  70,  80, ...,  74,  72,  70]], dtype=uint8)


cv2.add(img_cat,img_cat2)[:5,:,0]   # 查看图像的前5行的B通道的值

#输出结果

array([[255, 255, 255, ..., 255, 255, 255],
       [224, 234, 244, ..., 255, 255, 255],
       [226, 234, 246, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)

        注:对于(img_cat + img_cat2)[:5,:,0]输出结果中的38,为142+152=294-256=38,因为越界了,故给出溢出值。

               对于cv2.add(img_cat,img_cat2)[:5,:,0]的加法,溢出了则为255,不溢出则为原始值。


图像融合

#图像融合

img_cat + img_dog   # 图像的加法,每个像素相加,如果超过255,就取255

img_cat.shape     # 查看图像的大小



img_dog = cv2.resize(img_dog, (500, 414))   # 将图像的大小调整为和猫的图像大小一致
img_dog.shape                               # 查看图像的大小


res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)    # 图像的融合,第一个参数是第一张图像,第二个参数是第一张图像的权重,第三个参数是第二张图像,第四个参数是第二张图像的权重,第五个参数是gamma值


plt.imshow(res)  # 显示图像



res = cv2.resize(img, (0, 0), fx=4, fy=4)   # 图像的缩放,第一个参数是原图像,第二个参数是缩放后的图像大小,第三个参数是沿x轴的缩放比例,第四个参数是沿y轴的缩放比例
plt.imshow(res) # 显示图像



res = cv2.resize(img, (0, 0), fx=1, fy=3)   # 图像的缩放,第一个参数是原图像,第二个参数是缩放后的图像大小,第三个参数是沿x轴的缩放比例,第四个参数是沿y轴的缩放比例
plt.imshow(res)                             # 显示图像

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值