第九天 OpenCV(1) 图像和视频的读取

最新推荐文章于 2023-08-19 16:54:56 发布

hang_AI427

最新推荐文章于 2023-08-19 16:54:56 发布

阅读量522

点赞数 1

本文链接：https://blog.csdn.net/qq_32752467/article/details/109007815

版权

1. 图像的读取（使用jupyter）

（1）opencv读取图像：( 彩色图像： cv2.IMREAD_COLOR，灰度图像：cv2.IMREAD_GRAYSCALE)<0---255>

import cv2
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

img = cv2.imread('cat.jpg')
img.shape # (440, 500, 3)

img有三个维度，（h,w,c），opencv默认的读取格式为BGR，不是RGB格式。最好用opencv自带的工具包展示。

（2）图像的显示，也可以创建多个窗口。

cv2.imshow('image', img) # 窗口显示，也可以创建多个窗口
cv2.waitKey(0) # 等待时间，毫秒级。0代表任意键（随便按任意键）终止。cv2.waitKey(1000)代表显示1000毫秒自动触发关闭，所有窗口关闭。
cv2.destoryAllWindows() # 触发关闭，所有窗口关闭。

调用函数方式：

 def cv_show(name, img):
     cv2.imshow(name, img)
     cv2.waitKey(0)
     cv2.destoryAllWindows()

（3）原始图像是彩色的，如果我想读取灰度图像(灰度图和彩色图的转换)，则使用如下代码：

img = cv2.imread('cat.jpg', cv2.IMREAD_GRAYSCALE)
img.shape # (414, 500)

（4）图像的保存：

 cv2.imwrite('mycat.png', img) # True

（5）其余操作

type(img) # numpy.ndarray
img.size # 207000
img.dtype # dtype('uint8')

二：视频的读取

cv2.VideoCapture可以捕获摄像头，用数字来控制不同的设备。例如0，1

如果是视频文件，直接指定路径即可。视频也是由图像一帧一帧组成。

对视频操作就是把视频拆分成每一帧（图像），对每一帧（图像）进行操作。

 vc = cv2.VideoCapture('test.mp4')

查看读取的视频能不能打开。vc.read()读取第一帧，再vc.read()读取第二帧，再 vc.read()读取第三帧。open就是是否读进来，frame就是读取的每一帧（图像），就是一中的图像。

if vc.isOpened():
    open, frame = vc.read()
else:
    open = False

我现在想要看test.mp4的灰度视频，需要用opencv执行一下操作：

（1）：读取每一帧图片，为空停止。

（2）：每读取一张图像，就把图像转化为灰度图。cv2.cvtColor(frame, cv2.COLOR_BGR_BGR2GRAY)

（3）：连贯--->读取一帧图片，转化为灰度图，展示出来，然后展示XXX毫秒，读取第二帧图像，转化为灰度图，展示出来，然后展示XXX毫秒，读取第三帧图像，转化为灰度图，展示出来。。。。读取图像为空，结束。销毁窗口。

while open: #  只要能打开 open == True
    ret, frame = vc.read()
    if frame is None:
        break
    if ret == True:
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR_BGR2GRAY)
        cv2.imshow('result', gray)
        if cv2.waitKey(10) & 0xFF == 27:  # 27表示我们的退出键（直接退出，销毁窗口）
            break
vc.release() # 释放硬件资源
cv2.destoryAllWindows()

三：截取部分图像数据

既然是ndarray的类型，就可以进行切片操作。

img = cv2.imread('cat.jpg')
cat = img[0:200, 0:200]
cv_show('cat', cat)

四：颜色通道提取

（1）颜色通道提取，将B，G，R三个通道提取出来：

b, g, r = cv2.split(img)
b.shape # (414, 500)

（2）假设处理完了，将B，G，R三个通道合并进去：

img = cv2.merge((b, g, r))
img.shape # (414, 500, 3)

（3）如果最终结果只保留一个通道，就需要将其余通道置0。

因为是三维的，也可以用切片实现：

# 只保留R，其余的操作都一样
cur_img = img.copy() #先复制一个
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('R', cur_img)

五：边界填充（存在下面五种填充方式）

- BORDER_REPLICATE：复制法，也就是复制最边缘像素。
- BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb   
- BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
- BORDER_WRAP：外包装法cdefgh|abcdefgh|abcdefg  
- BORDER_CONSTANT：常量法，常数值填充。

代码如下：表示上下左右分别填充50个像素点。填充方式只需要改最后的borderType就可以了。

top_size,bottom_size,left_size,right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)

六：数值计算

既然读取的图像是ndarray类型的，是不是可以进行数值进算呢？

img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')

img_cat2= img_cat +10 # 将img_cat + 10的结果是所有值都+10
img_all = img_cat + img_cat2  # 数值相加超过255了，那就取余(例如：278 % 255)
img_all_cv2 = cv2.add(img_cat,img_cat2) # cv2里的add超过255了，直接就取255了。

七：图像融合

两个图像相加必须保证shape相同，下面这样直接加就会报错。

img_cat + img_dog

所以改变图像shape大小方法是cv2.resize()

img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape  # (414, 500, 3)

进行图像融合：0.4*img_cat+0.6*img_dog+0(其中0是偏置项)

res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)

注：resize方法还有一种格式（0，0）代表我不指定具体数值，我只有倍数的关系fx放大几倍就写几。====

res = cv2.resize(img, (0, 0), fx=3, fy=1)
plt.imshow(res)

hang_AI427

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
第九天 OpenCV(1) 图像和视频的读取

1. 图像的读取（使用jupyter）（1）opencv读取图像：( 彩色图像： cv2.IMREAD_COLOR，灰度图像：cv2.IMREAD_GRAYSCALE)<0---255>import cv2import matplotlib.pyplot as pltimport numpy as np%matplotlib inlineimg = cv2.imread('cat.jpg')img.shape # (440, 500, 3)img有三个维度，（h,w,.
复制链接

扫一扫