OpenCV图像的基本操作_opencv 图像操作-CSDN博客

本文链接：https://blog.csdn.net/weixin_48167570/article/details/117430506

图像基本操作

环境配置地址

Anaconda:Anaconda:https://www.anaconda.com/download/
Python_whl:https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv
资料链接:复制这段内容后打开百度网盘App，操作更方便哦。链接:https://pan.baidu.com/s/1nBs0RGffKamNNA4OlBIKdQ 提取码:3qp8

图像有很多像素点组成，RGB三通道，每个相当于一个矩阵，根据图像的像素来决定矩阵大小。
数据读取-图像
cv2.IMREAD_COLOR：彩色图像
cv2.IMREAD_GRAYSCALE：灰度图像

import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline #魔法指令，是jupyter notebook中特有的，为了方便图形的展示
img=cv2.imread('cat.jpg')

结果展示，RGB像素点值在[0,255]之间
array(
可以看出是三维度

	[[[142, 151, 160],
    [146, 155, 164],
    [151, 160, 169],
    ...,
    [156, 172, 185],
    [155, 171, 184],
    [154, 170, 183]], 
    
   [[107, 118, 126],
    [112, 123, 131],
    [117, 128, 136],
    ...,
    [155, 171, 184],
    [154, 170, 183],
    [153, 169, 182]],

   [[108, 119, 127],
    [112, 123, 131],
    [118, 129, 137],
    ...,
    [154, 170, 183],
    [153, 169, 182],
    [152, 168, 181]],

   ...,

   [[162, 186, 198],
    [157, 181, 193],
    [142, 166, 178],
    ...,
    [181, 204, 206],
    [170, 193, 195],
    [149, 172, 174]],

   [[140, 164, 176],
    [147, 171, 183],
    [139, 163, 175],
    ...,
    [167, 187, 188],
    [123, 143, 144],
    [104, 124, 125]],

   [[154, 178, 190],
    [154, 178, 190],
    [121, 145, 157],
    ...,
    [185, 198, 200],
    [130, 143, 145],
    [129, 142, 144]]], dtype=uint8)

#图像的显示,也可以创建多个窗口
cv2.imshow('image',img) 
# 等待时间，毫秒级，0表示任意键终止
cv2.waitKey(0) 
cv2.destroyAllWindows()

显示效果
在这里插入图片描述
为了方便，定义一个函数，用来显示图像

def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

img.shape

结果(414, 500, 3)，在cv中以BGR显示，h,w,c

img=cv2.imread("cat.jpg",cv2.IMREAD_GRAYSCALE)
img

array([[153, 157, 162, …, 174, 173, 172],
[119, 124, 129, …, 173, 172, 171],
[120, 124, 130, …, 172, 171, 170],
…,
[187, 182, 167, …, 202, 191, 170],
[165, 172, 164, …, 185, 141, 122],
[179, 179, 146, …, 197, 142, 141]], dtype=uint8)

img.shape

(414, 500)
得到一个颜色通道

cv_show("a",img)

在这里插入图片描述

#保存
cv2.imwrite("myCat.jpg",img)

#像素点个数
img.size
207000

#数据类型
img.dtype
dtype('uint8')

数据读取-视频

cv2.VideoCapture可以捕获摄像头，用数字来控制不同的设备，例如0,1。
如果是视频文件，直接指定好路径即可。

视频是由一帧一帧组成的

vc=cv2.VideoCapture("test.mp4")
# 检查是否打开正确
if vc.isOpened(): 
	#read()读取视频的每一帧，第一个参数为布尔型，能读取为true，第二个参数为一帧的图像
    oepn, frame = vc.read()
else:
    open = False
while oepn:
    ret, frame = vc.read()
    if frame is None:
        break
    #读取成功
    if ret == True:
    	#转换成灰度图
        gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY)
        #展示
        cv2.imshow('result', gray)
        #27在键盘上表示退出键esc
        if cv2.waitKey(100) & 0xFF == 27:
            break
vc.release()
cv2.destroyAllWindows()

截取部分图像数据

img=cv2.imread('cat.jpg')
cat=img[0:50,0:200] 
cv_show('cat',cat)

在这里插入图片描述 颜色通道提取

b,g,r=cv2.split(img)
r

array([[160, 164, 169, …, 185, 184, 183],
[126, 131, 136, …, 184, 183, 182],
[127, 131, 137, …, 183, 182, 181],
…,
[198, 193, 178, …, 206, 195, 174],
[176, 183, 175, …, 188, 144, 125],
[190, 190, 157, …, 200, 145, 144]], dtype=uint8)

r.shape

(414, 500)

# 只保留R
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('R',cur_img)


# 只保留G
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('G',cur_img)

# 只保留B
cur_img = img.copy()
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv_show('B',cur_img)

在这里插入图片描述

边界填充

BORDER_REPLICATE：复制法，也就是复制最边缘像素。
BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
BORDER_WRAP：外包装法cdefgh|abcdefgh|abcdefg
BORDER_CONSTANT：常量法，常数值填充。

top_size,bottom_size,left_size,right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

在这里插入图片描述
数值计算

img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')
#把img_cat这张图像素点(500x500x3)的每一个像素加上10
img_cat2= img_cat +10 
#打印前五行
img_cat[:5,:,0]

array([[142, 146, 151, ..., 156, 155, 154],
       [108, 112, 118, ..., 155, 154, 153],
       [108, 110, 118, ..., 156, 155, 154],
       [139, 141, 148, ..., 156, 155, 154],
       [153, 156, 163, ..., 160, 159, 158]], dtype=uint8)
       
       img_cat2[:5,:,0]
       
       array([[152, 156, 161, ..., 166, 165, 164],
       [117, 122, 127, ..., 165, 164, 163],
       [118, 122, 128, ..., 164, 163, 162],
       [149, 153, 158, ..., 166, 165, 164],
       [163, 168, 173, ..., 170, 169, 168]], dtype=uint8)
#相加超过256就会% 256，取余数
#相加的前提条件是：必须维度一样
(img_cat + img_cat2)[:5,:,0] 

array([[ 38,  46,  56, ...,  66,  64,  62],
       [224, 234, 244, ...,  64,  62,  60],
       [226, 234, 246, ...,  62,  60,  58],
       [ 32,  40,  50, ...,  66,  64,  62],
       [ 60,  70,  80, ...,  74,  72,  70]], dtype=uint8)
#只要相加之后大于255，就取值255
cv2.add(img_cat,img_cat2)[:5,:,0]

array([[255, 255, 255, ..., 255, 255, 255],
       [224, 234, 244, ..., 255, 255, 255],
       [226, 234, 246, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)

图像融合

#读取的两张图片
img_cat + img_dog

在这里插入图片描述
只要像素点完全一样才可以融合

img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape
res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)
plt.imshow(res)

在这里插入图片描述

res = cv2.resize(img, (0, 0), fx=4, fy=4)
plt.imshow(res)

在这里插入图片描述

res = cv2.resize(img, (0, 0), fx=1, fy=3)
plt.imshow(res)

在这里插入图片描述