【Opencv-Python】数字图像处理(一) —— 图像的基本操作


图像的基本操作

1. 实验目的和要求

2. 主要设备及环境

3. 实验内容及实验结果

3.0 实验准备

3.1 图像的读取

3.2 视频的读取

3.2.1 打开视频文件:

3.2.2 打开摄像头:

3.2.3 读取视频帧:

3.3 图像的显示

3.3.1 Opencv 方式

3.3.2 matplotlib 方式

3.4 图像的保存

3.4.1 读入彩色和灰度图像文件,并显示出来,同时给出图像的基本属性。

3.4.2 读取文件夹 images 的图像 lena.bmp,并显示出来。然后将图像另存为 lena.jpg,并比较两文件大小。

3.5 图像的通道拆分与合并

3.5.1 通道拆分

结论: 

3.5.2 通道合并

3.6 图像 ROI (region of interest )(图像剪裁)

3.6.1 运行实例 

3.6.2 思考题:怎样取出、修改图像某点的像素值?

3.7 图像坐标变换

3.7.1 图像缩放

(1)result = cv2.resize(src, (160,160)), 输出 result ,观察效果。

(2)result = cv2.resize(src, None, fx=0.5, fy=0.5), 输出 result,观察效果。

3.7.2 图像的仿射变换(实现图像缩放、图像旋转和图像平移)

3.8 图像色彩空间转化

3.8.1 运行实例:

3.8.2 思考:对比上一个 print 语句的输出有何不同?为什么?

4. 实验分析与思考


1. 实验目的和要求

(1)熟悉并掌握Python在处理图像方面的能力;

(2)精通在Python中使用opencv-python库读取图像的方法,包括读取不同格式的图像,以及调整图像大小、色彩转换等操作;

(3)掌握Python获取图像信息的方法,包括获取图像的大小、颜色、高度、宽度等相关信息,以及图像的通道等;

(4)掌握在Python中使用opencv-python按照指定要求存储一幅图像的方法,包括存储为不同格式的图像等操作;

(5)掌握图像间的转化方法,包括图像坐标变换和图像的色彩空间转化。

2. 主要设备及环境

(1)计算机;

(2)Python、Pycharm及Anaconda软件;

(3)典型的灰度、彩色图像文件。

3. 实验内容及实验结果

3.0 实验准备

        首先在程序开头导入 OpenCV 模块。

import cv2

3.1 图像的读取

        函数返回一个(行数(高),列数(宽),颜色通道数)的多维阵列,表示图像数据,默认的颜色次序为 BGR。

img = cv2.imread(文件名[,参数])

其中第一个参数为图像文件的路径,第二个参数(可选)的主要形式有:

(1) cv2.IMREAD_UNCHANGED (图像不可变);

(2) cv2.IMREAD_GRAYSCALE (灰度图像);

(3) cv2.IMREAD_COLOR (读入彩色图像),这是默认参数,不填的话默认为这个。

import cv2
jpg = cv2.imread('D:\images\lena_noise.jpg')
print(jpg.shape)

运行结果:

print(image.shape) 返回一个三元组,分别是图像的高度宽度颜色通道数。

3.2 视频的读取

        用同样的方法读取视频文件、USB 摄像头及监控摄像头的视频帧。

#打开视频文件
cap=cv2.VideoCapture('./images/1.avi')


#打开内置或 USB 摄像头,0 表示第一个摄像头
cap=cv2.VideoCapture(0)

#判断 VideoCaputre 对象是否成功打开,只有成功打开才能进行读操作

if cap.isOpened():                                      #VideoCaputre 对象成功打开
        print('已经打开了视频文件或摄像头')
else:
        print('视频文件或摄像头打开失败')

3.2.1 打开视频文件:
mp4 = cv2.VideoCapture('D:/video/zoo.mp4')
if mp4.isOpened(): #VideoCaputre 对象成功打开
    print('已经打开了视频文件')
else:
    print('视频文件打开失败')

运行结果:

删除视频文件后运行结果:

3.2.2 打开摄像头:
cap=cv2.VideoCapture(0)
if cap.isOpened(): #VideoCaputre 对象成功打开
     print('已经打开了摄像头')
else:
     print('摄像头打开失败')

运行结果:

3.2.3 读取视频帧:

ret, frame = cap.read()   # 读取一帧视频

其中 ret 是布尔值,如果读取帧是正确的则返回 True,如果文件读取到结尾,它的返回值就为 False。frame 就是每一帧的图像,是个三维矩阵。

import cv2
# 打开视频
mp4 = cv2.VideoCapture('D:/video/zoo.mp4')
if mp4.isOpened(): #VideoCaputre 对象成功打开
    print('已经打开了视频文件')
else:
    print('视频文件打开失败')
    exit()
while True:
    # 读取一帧视频
    ret, frame = mp4.read()  # 读取一帧视频
    if not ret:
        break  # 如果无法读取帧,则跳出循环
    # 显示原始帧
    cv2.imshow('frame', frame)  # 显示原始帧
    # 如果按下 'q' 键,则退出循环
    if cv2.waitKey(1) & 0xFF == ord('q'):  # 如果按下 'q' 键,则退出循环
        break
    # 释放摄像头并关闭所有窗口
mp4.release()
cv2.destroyAllWindows()

运行结果:

3.3 图像的显示

3.3.1 Opencv 方式

cv2.imshow(窗口名, img)


cv2.waitKey(0)

#等待显示,如果没有这句的话,图片就会显示一下立马消失
#0 表示无限制的等待(按任意键就退出),大于 0(如 5)表示等待 5ms 自
#动关闭窗口


cv2.destroyAllWindows()      #从内存将窗口清除

jpg = cv2.imread('D:\images\lena_noise.jpg')
cv2.namedWindow("demo1")
cv2.imshow("demo1",jpg)
cv2.waitKey(delay = 0)#等待显示,如果没有这句的话,图片就会显示一下立马消失
#0 表示无限制的等待(按任意键就退出),大于 0(如 5)表示等待 5ms 自动关闭窗口
cv2.destroyAllWindows() #从内存将窗口清除

运行结果:

3.3.2 matplotlib 方式

from matplotlib import pyplot as plt             #首先导入 pyplot 模块


rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

#将 opencv 用的的 BGR 通道顺序变为 plt 用
#的 RGB 顺序 


plt.imshow(rgb)
plt.xticks([]), plt.yticks([])
plt.show()

import cv2
jpg = cv2.imread('D:\images\lena_noise.jpg')
from matplotlib import pyplot as plt #首先导入 pyplot 模块
rgb = cv2.cvtColor(jpg, cv2.COLOR_BGR2RGB) #将 opencv 用的的 BGR 通道顺序变为 plt 用的 RGB 顺序
plt.imshow(rgb)
plt.xticks([]), plt.yticks([])
plt.show()

运行结果:

3.4 图像的保存

cv2.imwrite(文件名, img)

3.4.1 读入彩色和灰度图像文件,并显示出来,同时给出图像的基本属性。
import cv2
img = cv2.imread("D:/images/mother_baby.tif ")
print('color image shape: ', img.shape) #打印出彩色图像的形状信息
print('color image size: ', img.size) #打印出彩色图像的大小
print('color image 数据类型: ', img.dtype) #图像数据的类型
print('\n')
#获取图像高、宽:
#rows, cols = img.shape[:2]
rows = img.shape[0]
cols = img.shape[1]
print('color image width: ', cols)
print('color image height: ', rows)
print('\n')  #换行
img_gray = cv2.imread("D:/images/lena_gray_256.tif", cv2.IMREAD_UNCHANGED)
print('gray image shape: ', img_gray.shape)
print('gray image size: ', img_gray.size)
print('gray image 数据类型: ', img_gray.dtype)
print('\n')
rows_gray = img_gray.shape[0]
cols_gray = img_gray.shape[1]
print('gray image width: ', cols_gray)
print('gray image height: ', rows_gray)
# 显示图像
cv2.imshow("color image ", img)
cv2.imshow("gray image ", img_gray)
# 等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

3.4.2 读取文件夹 images 的图像 lena.bmp,并显示出来。然后将图像另存为 lena.jpg,并比较两文件大小。
import cv2
# 读取图像
img = cv2.imread("D:/images/lena.bmp")
# 另存为 lena.jpg
cv2.imwrite("D:/images/lena.jpg", img)
# 打印原始图像大小
print('lena bmp size: ', img.size)
# 打印jpg图像大小
jpg_lena = cv2.imread("D:/images/lena.jpg")
print('lena jpg size: ', jpg_lena.size)
# 显示原始图像
cv2.imshow('BMP Image', img)
# 显示jpg图像
cv2.imshow('JPG Image', jpg_lena)
# 等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果:

3.5 图像的通道拆分与合并

3.5.1 通道拆分

        拆分后,输出 b,g,r 三幅图像。看看哪幅图像最亮,并解释原因。

方法一:

b, g, r = cv2.split(img)

方法二:

b = img[:, :, 0]

g = img[:, :, 1]

r = img[:, :, 2]

方法三:

b = cv2.split(img)[0]

g = cv2.split(img)[1]

r = cv2.split(img)[2]

import cv2
import numpy as np
# 创建一个彩色图像
img = cv2.imread('D:/images/lena.bmp')
# 使用cv2.split()分割图像
b, g, r = cv2.split(img)
# 保存为图像
cv2.imwrite('blue_channel.jpg', b)
cv2.imwrite('green_channel.jpg', g)
cv2.imwrite('red_channel.jpg', r)
# 分别显示三个通道的图像
cv2.imshow('Blue Channel', b)
cv2.imshow('Green Channel', g)
cv2.imshow('Red Channel', r)
# 打印每个通道的亮度(即像素值范围)
print('Blue Channel brightness:', np.max(b))
print('Green Channel brightness:', np.max(g))
print('Red Channel brightness:', np.max(r))
# 等待键盘输入并关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

结论: 

        哪幅图像最亮取决于图像的内容和颜色分布。在图像中,红色通道是最亮的,其次,蓝色通道比绿色通道亮,因为空气对蓝色光的散射强。

3.5.2 通道合并

m = cv2.merge([b, g, r])

import cv2
# 创建一个彩色图像
img = cv2.imread('D:/images/lena.bmp')
# 使用cv2.split()分割图像
b, g, r = cv2.split(img)
# 保存为图像
cv2.imwrite('blue_channel.jpg', b)
cv2.imwrite('green_channel.jpg', g)
cv2.imwrite('red_channel.jpg', r)
# 分别显示三个通道的图像
cv2.imshow('Blue Channel', b)
cv2.imshow('Green Channel', g)
cv2.imshow('Red Channel', r)
# 将通道合并
merged_img = cv2.merge([b, g, r])
# 显示合并后的图像
cv2.imshow('Merged Image', merged_img)
# 关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

3.6 图像 ROI (region of interest )(图像剪裁)

img = cv2.imread("图像文件名")

subimg=img[r1:r2, c1:c2]

# 输出 subimg,观察效果。

3.6.1 运行实例 
import cv2
# 读取图像
img = cv2.imread('D:/images/lena.bmp')
# 截取子图像
subimg = img[50:150, 100:200]
# 显示子图像
cv2.imshow('Subimage', subimg)
# 等待键盘输入,然后关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

3.6.2 思考题:怎样取出、修改图像某点的像素值?

        导入图像,将它转化为数组形式,对每一个像素点的像素值进行调整和修改并输出。

3.7 图像坐标变换

3.7.1 图像缩放
(1)result = cv2.resize(src, (160,160)), 输出 result ,观察效果。
import cv2
# 加载图像
src = cv2.imread('D:/images/lena.bmp')
# 缩放图像
result = cv2.resize(src, (160, 160))
# 保存缩放后的图像
cv2.imwrite('resized_image.jpg', result)
# 显示图像
cv2.imshow('result', result)
# 等待键盘输入,然后关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

(2)result = cv2.resize(src, None, fx=0.5, fy=0.5), 输出 result,观察效果。
import cv2
# 加载图像
src = cv2.imread('D:/images/lena.bmp')
# 修改图像
result = cv2.resize(src, None, fx=0.5, fy=0.5)
# 保存修改后的图像
cv2.imwrite('resized_image.jpg', result)
# 显示图像
cv2.imshow('result', result)
# 等待键盘输入,然后关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

3.7.2 图像的仿射变换(实现图像缩放、图像旋转和图像平移)

         编写程序来使用 cv2.warpAffine() 函数(先读入图像,然后用该函数对图像做各种变换,最后显示各种变换后的图像效果)。

import cv2
import numpy as np
# 读入图像
img = cv2.imread('D:/images/lena.bmp')
# 定义变换矩阵
M = np.float32([[1, 0, 100], [0, 1, 50]])
# 进行变换
dst = cv2.warpAffine(img, M, (img.shape[1], img.shape[0]))
# 显示原图和变换后的图像
cv2.imshow('Original Image', img)
cv2.imshow('Affine Transformed Image', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

3.8 图像色彩空间转化

dst = cv2.cvtColor(src, 参数)

其中常用的参数有:

cv2.COLOR_BGR2GRAY

cv2.COLOR_BGR2RGB

cv2.COLOR_BGR2HSV

cv2.COLOR_RGB2BGR

cv2.COLOR_GRAY2BGR

3.8.1 运行实例:
import cv2
img = cv2.imread("D:/images/lena.bmp")
print('image shape: ', img.shape)
# 图像颜色转换
gray_img= cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print('gray image shape: ', gray_img.shape)
# 显示图像
cv2.imshow("src", img)
cv2.imshow("result", gray_img)
# 等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

输出结果:

3.8.2 思考:对比上一个 print 语句的输出有何不同?为什么?

        原始图像的形状通常为 (height, width, channels),其中channels通常为3(对应RGB)。灰度图像的形状为 (height, width),因为灰度图像只有一个通道。

4. 实验分析与思考

       在实验中遇到预想之外的问题(比如得到的图像处理效果与预期不同),自己找到原因,并想到办法加以解决。

        (1)运行时,配置环境未选择anaconda,所以报错,选择后解决;

        (2)img= cv2.imread('D:\images\lena_noise.jpg') 报错,因为返回值不是img,应该是jpg,修改成jpg之后运行成功;

        (3)print(image.shape)返回一个三元组,分别是图像的高度,宽度和颜色通道数;

        (4)变量“jpg”没有被定义,要在调用cv2.cvtColor(jpg, cv2.COLOR_BGR2RGB)之前读取一张图片并将其存储在变量“jpg”中;

        报错:

        添加语句后:


  如果觉得作者写得还不错的话, 点赞 / 收藏 / 评论 / 转发 四连支持一下吧~😘

最重要的是点一个大大的关注, 你的支持就是作者创作的最大动力!!!❤

 


  • 39
    点赞
  • 71
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值