opencv图像基本操作

十有久诚

已于 2023-12-05 15:55:16 修改

阅读量54

点赞数 7

分类专栏： opencv计算机视觉文章标签： opencv 人工智能计算机视觉

于 2023-10-29 15:35:53 首次发布

本文链接：https://blog.csdn.net/weixin_50917576/article/details/134103393

版权

opencv计算机视觉专栏收录该内容

6 篇文章 0 订阅

订阅专栏

环境配置地址

- Anaconda:https://www.anaconda.com/download/

- Python_whl:https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv

数据读取-图像

cv2.IMREAD_COLOR：彩色图像

cv2.IMREAD_GRAYSCALE：灰度图像

import cv2 #！opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline 

img=cv2.imread('yellow cat.jpeg')

#输出h,w,c
img.shape

(720, 1080, 3)

#图像的显示,也可以创建多个窗口
cv2.imshow('window name',img) 
# 等待时间，毫秒级，0表示任意键终止
cv2.waitKey(0) 
# cv2.waitKey(1000)  #1000毫秒后消失
cv2.destroyAllWindows()

定义成一个函数

def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

cv2.IMREAD_COLOR：彩色图像 cv2.IMREAD_GRAYSCALE：灰度图像

img=cv2.imread('yellow cat.jpeg',cv2.IMREAD_GRAYSCALE)
img

array([[117, 114, 113, ..., 168, 167, 166],
       [110, 107, 104, ..., 168, 167, 167],
       [ 98,  96,  93, ..., 169, 168, 167],
       ...,
       [ 16,  18,  19, ..., 125, 125, 125],
       [ 17,  18,  20, ..., 124, 124, 124],
       [ 17,  19,  20, ..., 123, 123, 123]], dtype=uint8)

#输出灰度图
cv_show("only one channel",img)

#保存在当前目录
cv2.imwrite('yellow cat.png',img)

查看数据类型

type(img)
img.dtype

像素点的个数

img.size

数据读取-视频

cv2.VideoCapture可以捕获摄像头，用数字来控制不同的设备，例如0,1。
如果是视频文件，直接指定好路径即可。

vc = cv2.VideoCapture('test.mp4')

是否正常打开

vc.isOpened()

# 检查是否打开正确
if vc.isOpened(): 
    #is_open：是否正常打开
    #frame不断读取下一帧，为一张图片
    is_open, frame = vc.read()
else:
    open = False

while open:
    ret, frame = vc.read()
    #读不到帧，就跳出循环
    if frame is None:
        break
    if ret == True:
        #将彩色的帧转换成灰度图；COLOR_BGR2GRAY把彩色rgb转换成灰度图
        gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY)
        cv2.imshow('result', gray)
        #waitKey=1时，计算机处理有多快就展示多快
        #27为退出键，按推出键esc，进入break,直接跳出循环
        #waitKey越大，换一帧的时间就越久
        if cv2.waitKey(100) & 0xFF == 27:
            break
vc.release()
cv2.destroyAllWindows()

截取部分图像数据

img=cv2.imread('yellow cat.jpeg')
#img是一个ndarray的结构，按数值处理
cat=img[0:500,0:250] 
cv_show('cat',cat)

颜色通道提取

#与我们常见(b、r、g)的不同
b,g,r=cv2.split(img)

b,g,r三个通道的大小(形状)都相同

r.shape

img=cv2.merge((b,g,r))
img.shape

只保留R

# 只保留R
cur_img = img.copy()
#将b通道的数据值取0
cur_img[:,:,0] = 0
#将r通道的数据值取0
cur_img[:,:,1] = 0
cv_show('R',cur_img)

只保留G

# 只保留G
cur_img = img.copy()
#把其他两个通道的值置为0
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('G',cur_img)

边界填充

#指定上、下、左、右填充的大小
top_size,bottom_size,left_size,right_size = (50,50,50,50)
img=cv2.imread('cat.jpg')
#borderType按照什么样的方式进行填充
replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
#value=0即拿黑色填充
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)

import matplotlib.pyplot as plt
#展示原图
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
#直接复制边缘的特征来填充
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
#反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
#反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
#左边填充时以a为轴，右边填充时以h为轴
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
#外包装法abcdefgh|abcdefgh|abcdefg
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

BORDER_REPLICATE：复制法，也就是复制最边缘像素。
BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
BORDER_WRAP：外包装法abcdefgh|abcdefgh|abcdefg
BORDER_CONSTANT：常量法，常数值填充。

数值计算

img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')
# matplotlib应该是按r、g、b通道顺序绘画的，而opencv读取的格式是BGR
#这里采用cv2.COLOR_BGR2RGB解决
img_cat_rgb = cv2.cvtColor(img_cat, cv2.COLOR_BGR2RGB)

plt.subplot(121),plt.imshow(img_cat_rgb)
img_cat_rgb2=img_cat_rgb+10
#太白的本身像素值很高，再加10越界跑到数值小的那边了，所以本身特别白的地方变黑了
plt.subplot(122),plt.imshow(img_cat_rgb2)

#me:数值越大，图像越白
img_cat2= img_cat +10 
img_cat[:5,:,0]

#对越界的相当于% 256
(img_cat + img_cat2)[:5,:,0]

#越界直接取255
cv2.add(img_cat,img_cat2)[:5,:,0]

图像融合

#不同shape，没办法直接相加
img_cat + img_dog

img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape

0.4为img_cat的权重，0.6为img_dog的权重，最后一个参数0为偏置值

res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)

长乘4倍，宽乘4倍

res = cv2.resize(img_cat, (0, 0), fx=4, fy=4)
plt.imshow(res)

十有久诚

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
opencv图像基本操作

cv2.IMREAD_COLOR：彩色图像 cv2.IMREAD_GRAYSCALE：灰度图像。0.4为img_cat的权重，0.6为img_dog的权重，最后一个参数0为偏置值。cv2.IMREAD_GRAYSCALE：灰度图像。cv2.IMREAD_COLOR：彩色图像。b,g,r三个通道的大小(形状)都相同。
复制链接

扫一扫