OpenCV计算机视觉实战 | 第2章图像的基本操作

最新推荐文章于 2024-05-10 14:21:06 发布

mustuo

最新推荐文章于 2024-05-10 14:21:06 发布

阅读量987

点赞数

分类专栏： # 计算机视觉文章标签：计算机视觉 opencv python

本文链接：https://blog.csdn.net/mustuo/article/details/122914818

版权

计算机视觉专栏收录该内容

10 篇文章 1 订阅

订阅专栏

本文为《OpenCV计算机视觉实战》课程的笔记。

1 图像的基本概念

图像的表示：计算机中，图像由像素点组成。
像素点取值：[0, 255] 数值表示图像的亮度，数值越大越亮
彩色图像颜色通道：RGB，每个通道上都有一个亮度值

注：灰度图只有一个通道

图像的表示：图像的每个通道都由亮度值的矩阵组成

2 图像的基本操作

2.1 图像的读取

彩色图像：cv2.IMREAD_COLOR，读取后得到的是一个三维矩阵
灰度图像：cv2.IMREAD_GRAYSCALE，读取后得到一个二维矩阵

import cv2

path = './img/green.jpg'
img = cv2.imread(path)

img_gray =cv2.imread(path, cv2.IMREAD_GREAYSCALE)

注意，这里读取路径中不能有中文！如果文件位于当前路径下可使用./xxx，否则img将为空。

读入后img的数据类型是uint8的矩阵。

图像可以使用opencv自带工具包或matplotlib进行展示。注意，opencv的通道顺序是BGR，而matplotlib是RGB。

2.2 图像的显示

# 创建一个窗口进行显示
cv2.imshow('image',img)

# 设置一个等待时间，单位毫秒，使窗口不自动关闭
cv2.waitKey(0) # 按任意键关闭窗口。若将0改成1000，则表示等待1s后窗口自动关闭
cv2.destroyAllWindows()

2.3 查看图像的基本信息

# 图像的尺寸(h,w,c)
img.shape

# 查看数据结构类型
type(img) # numpy.ndarray

# 查看数据类型
img.dtype # dtype('uint8')

# 查看像素点个数
img.size

type、dtype的区别：[链接](python 中的 type(), dtype(), astype()的区别_Strive_For_Future的博客-CSDN博客)

函数	说明
type()	返回数据结构类型（list、dict、numpy.ndarray 等）
dtype()	返回数据元素的数据类型（int、float等）备注：1）由于 list、dict 等可以包含不同的数据类型，因此不可调用dtype()函数 2）np.array 中要求所有元素属于同一数据类型，因此可调用dtype()函数
astype()	改变np.array中所有数据元素的数据类型。备注：能用dtype() 才能用 astype()

2.4 图像的保存

cv2.imwrite('./img/green_gray.jpg',img_gray)

2.5 边界填充

top_size, bottom_size, left_size, right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img_cat, top_size, bottom_size, left_size, right_size, borderType = cv2.BORDER_CONSTANT, value=0)

plt.subplot(231), plt.imshow(img_cat, 'gray'),plt.title('ORINGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'),plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'),plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'),plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'),plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'),plt.title('CONSTANT')

plt.show()

3 视频的读取和处理

3.1 视频的读取

cv2.VideoCaputre可用于捕获指定摄像头，用数字来控制不同的设备，如0、1

若是调用视频文件，则直接指定路径即可。

# 读入视频
vc = cv2.VideoCapture('./img/wzry.mp4')

# 检查是否打开正确
if vc.isOpened():
    open, frame = vc.read() 
    # 每次调用read()，都读取一个帧。若读取成功，open标志为True
else:
    open = Flase
    
while open:
    ret,frame =vc.read()
    if frame is None:
        break
    if  ret == True:
        vc_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) #将每一帧都转换为灰度图
        cv2.imshow('result', vc_gray)
        if cv2.waitKey(10) & 0xFF == 27:
            # 按退出键后退出
            # 这边的cv2.waitKey(10)表示每帧之间间隔10ms
            break
            
vc.release()
cv2.destroyAllWindows()

4ROI区域

ROI：感兴趣的区域

4.1 截取部分图像数据

本质上是数组的切片。

img = cv2.imread('./img/green.jpg')
img_roi = img[:50, :200]
cv_show('img_roi',img_roi)

4.2 颜色通道提取

b,g,r = cv2.split(img)

b g r的矩阵值不同，但三者的shape是一样的。

4.3 通道合并

本质上是矩阵的合并。

img = cv2.merge((b,g,r))
img.shape # (1362, 2560, 3)

注意，要按BGR通道顺序进行合并。

4.4 只保留某一个通道

# 只保留R，即G和B都为0
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('r',cur_img)

# 只保留B
cur_img = img.copy()
cur_img[:,:,2] = 0
cur_img[:,:,1] = 0
cv_show('b',cur_img)

# 只保留g
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('g',cur_img)

5 数值计算

5.1 图像叠加

5.1.1 对单张图做加法

img2 = img + 10
# 每一个元素都+10

5.1.2 两张图相加

==注意：==图像大小得一样

1、用“+”计算：计算结果自动对256取模

(img + img2)[:5,:,0]

2、用cv自带方法计算：若越界，则取255

cv2.add(img,img2)[:5,:,0]

5.2 图像融合

前提：融合的两张图像尺寸要相同

img_cat = cv2.imread('./img/cat.jpg')
img_dog = cv2.imread('./img/dog.jpg')

图像缩放：

# 图像缩放
img_cat = cv2.resize(img_cat,(500,500))
img_dog = cv2.resize(img_dog,(500,500))

# 图像按倍数缩放
res = cv2.resize(img_cat, (0,0), fx=3, fy=1)
plt.imshow(res)

图像融合：cv2.addWeighted()

# 按权重融合
res = cv2.addWeighted(img_cat, 0.6, img_dog, 0.4, 0)
plt.imshow(res)
# cv_show('comb',res)

mustuo

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
OpenCV计算机视觉实战 | 第2章图像的基本操作

本文为《OpenCV计算机视觉实战》课程的笔记。1 图像的基本概念图像的表示：计算机中，图像由像素点组成。像素点取值：[0, 255] 数值表示图像的亮度，数值越大越亮彩色图像颜色通道：RGB，每个通道上都有一个亮度值注：灰度图只有一个通道图像的表示：图像的每个通道都由亮度值的矩阵组成2 图像的基本操作2.1 图像的读取彩色图像：cv2.IMREAD_COLOR，读取后得到的是一个三维矩阵灰度图像：cv2.IMREAD_GRAYSCALE，读取后得到一个二维矩阵im.
复制链接

扫一扫