OpenCV-Python实战（2）——图像与视频文件的处理_pythonopencv处理视频

最新推荐文章于 2024-05-21 22:22:59 发布

冉静学习开发

最新推荐文章于 2024-05-21 22:22:59 发布

阅读量959

点赞数 14

分类专栏： 2024年程序员学习文章标签： opencv python 音视频

本文链接：https://blog.csdn.net/m0_61331407/article/details/138047909

版权

2024年程序员学习专栏收录该内容

292 篇文章 1 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Python知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024c （备注Python）

正文

while capture.isOpened():

逐帧获取相机画面

ret, frame = capture.read()
if ret is True:

显示捕获的帧画面

cv2.imshow(‘Input frame from the camera’, frame)

获取的相机帧画面与 OpenCV 读取的图像具有相同的结构，因此可以像处理图像一样处理它。例如，要将帧画面转换为灰度：

将从相机捕获的帧转换为灰度图像

gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

显示灰度帧图像

cv2.imshow(‘Grayscale input camera’, gray_frame)

接下来，实现按下 q 键退出程序的功能，ord('q') 返回 q 字符对应的 8 位 ASCII 值，而 cv2.waitKey() 与 0xFF 的按位与 (&) 运算用于仅获取 cv2.waitKey() 的最后 8 位。因此，可以对这两个值进行比较，如果相等则退出程序：

按下 q 键可退出程序执行

if cv2.waitKey(20) & 0xFF == ord(‘q’):
break

最后，释放所有内容 (cv2.VideoCapture，并销毁创建的窗口)：

capture.release()
cv2.destroyAllWindows()

通过在命令行中执行以下命令，运行脚本：

python read_camera.py 0

可以看到运行结果显示了相机获取的实时画面：

获取相机画面

3.2 访问捕获画面对象的属性

可以使用 capture.get(property_identifier) 访问 capture 对象的某些属性，例如帧宽度、帧高度和每秒帧数 (Frames Per Second, FPS)。如果调用不受支持的属性，则返回值将为 0：

import cv2

capture = cv2.VideoCapture(0)

获取 VideoCapture 的属性 (frame width, frame height and frames per second (fps)):

frame_width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)
frame_height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)
fps = capture.get(cv2.CAP_PROP_FPS)

打印属性值

print(“CV_CAP_PROP_FRAME_WIDTH: ‘{}’”.format(frame_width))
print(“CV_CAP_PROP_FRAME_HEIGHT : ‘{}’”.format(frame_height))
print(“CAP_PROP_FPS : ‘{}’”.format(fps))

Check if camera opened successfully

if capture.isOpened()is False:
print(“Error opening the camera”)

while capture.isOpened():
ret, frame = capture.read()

if ret is True:
cv2.imshow(‘Input frame from the camera’, frame)
if cv2.waitKey(20) & 0xFF == ord(‘q’):
break
else:
break

capture.release()
cv2.destroyAllWindows()

执行此脚本将会打印如下属性信息：

CV_CAP_PROP_FRAME_WIDTH: ‘640.0’
CV_CAP_PROP_FRAME_HEIGHT : ‘480.0’
CAP_PROP_FPS : ‘30.0’

3.3 保存相机画面

可以修改前面的示例以在处理流程中添加其他的功能。例如，我们可能想将一些关键的感兴趣帧保存到磁盘中。在以下示例 read_camera_capture.py 中，将添加此示例功能，当按下键盘上的 c 键时，将当前帧保存到磁盘(同时保存 BGR 和灰度帧)：

import cv2
import argparse

capture = cv2.VideoCapture(0)
if capture.isOpened() is False:
print(“Error opening the camera”)
frame_index = 0
while capture.isOpened():
ret, frame = capture.read()

if ret is True:
gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

保存相机画面

if cv2.waitKey(20) & 0xFF == ord(‘c’):
frame_name = “camera_frame_{}.png”.format(frame_index)
gray_frame_name = “grayscale_camera_frame_{}.png”.format(frame_index)

将当前帧保存到磁盘(同时保存 BGR 和灰度帧)

cv2.imwrite(frame_name, frame)
cv2.imwrite(gray_frame_name, gray_frame)
frame_index += 1
if cv2.waitKey(20) & 0xFF == ord(‘q’):
break
else:
break

capture.release()
cv2.destroyAllWindows()

当按下 c 键时，首先构造两个文件名；然后，将两个图像保存到磁盘；最后，frame_index 递增，以便为保存下一帧做好准备。

3.4 读取视频文件

cv2.VideoCapture 也可以用于读取视频文件，要读取视频文件，应在创建 cv2.VideoCapture 对象时提供视频文件的路径，编写 read_video_file.py 脚本：

import cv2
import argparse

parser = argparse.ArgumentParser()
parser.add_argument(“video_path”, help=“path to the video file”)
args = parser.parse_args()
capture = cv2.VideoCapture(args.video_path)
if capture.isOpened() is False:
print(“Error opening the video file!”)

while capture.isOpened():
ret, frame = capture.read()
if ret is True:
cv2.imshow(‘Original frame from the video file’, frame)
gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow(‘Grayscale frame’, gray_frame)
if cv2.waitKey(20) & 0xFF == ord(‘q’):
break
else:
break
capture.release()
cv2.destroyAllWindows()

通过在命令行中执行以下命令，运行脚本：

python read_video_file.py xinlingqilv.mp4

可以看到运行结果开始播放视频文件：

播放视频文件

3.5 读取 IP 摄像机

cv2.VideoCapture 也可以从 IP 摄像头读取数据。在 OpenCV 中从 IP 摄像头读取数据与从文件读取数据非常相似。唯一需要修改的是提供给 cv2.VideoCapture 构造函数的参数。可以使用本地网络中的 IP 摄像机或尝试连接公共 IP 摄像机。

4. 保存视频文件

接下来，首先介绍与视频相关的基本概念(例如，fps、编解码器和视频文件格式等)，然后将了解如何使用 cv2.VideoWriter 保存视频文件。

4.1 计算帧率(FPS)

FPS 是计算机视觉项目中的一个重要指标，该指标表示每秒处理的帧(画面)数，FPS 越高越好。但是，算法每秒应处理的帧数将取决于需要解决的特定问题。例如，如果算法需要跟踪和检测在街上行走的人，那么 15 FPS 可能就足够了。但是，如果是检测和跟踪高速公路上快速行驶的汽车，则可能需要 20-25 FPS。
因此，计算计算机视觉项目中的 FPS 指标非常重要。编写 read_camera_fps.py 以输出 FPS：

import cv2
import argparse
import time

capture = cv2.VideoCapture(0)

if capture.isOpened() is False:
print(“Error opening the camera”)

while capture.isOpened():
ret, frame = capture.read()
if ret is True:
processing_start = time.time()
cv2.imshow(“Input frame from the camera”, frame)
gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow(‘Grayscale input camera’, gray_frame)
if cv2.waitKey(20) & 0xFF == ord(‘q’):
break
processing_end = time.time()
processing_time_frame = processing_end - processing_start
print(“FPS: {}”.format(1.0 / processing_time_frame))
else:
break

capture.release()
cv2.destroyAllWindows()

在上述示例脚本中，首先需要获取处理开始的时间：

processing_start = time.time()

然后，获取所有处理完成后的时间：

processing_end = time.time()

接下来，计算时间差：

processing_time_frame = processing_end - processing_start

最后，计算并打印 FPS：

print(“FPS: {}”.format(1.0 / processing_time_frame))

4.2 写入视频文件的流程

视频编码是一种用于压缩和解压缩数字视频的程序。具体而言，编解码器可用于将未压缩的视频转换为压缩后的视频，或者可用于将压缩的视频转换为未压缩的视频。压缩视频格式通常遵循视频压缩规范或视频编码格式的标准规范。OpenCV 提供了 FOURCC (一个 4 字节编码)，用于指定视频编解码器，查看可用编码列表获取更多可用编码。应该注意的是：支持的编解码器是平台相关的，如果想使用特定的编解码器，则应该在系统上安装该编解码器。典型的编解码器包括 DIVX、XVID、X264 和 MJPG。
视频文件格式是一种用于存储数字视频数据的文件格式，典型的视频文件格式包括 AVI(*.avi)、MP4(*.mp4)、QuickTime(*.mov) 和 Windows Media Video(*.wmv)。
最后，应该考虑到视频文件格式和 FOURCC 之间需要进行正确的组合。在 OpenCV 中创建视频文件时，必须考虑这些因素：

写入视频文件的流程

上图总结了在 OpenCV 中使用 cv2.VideoWriter() 创建视频文件时应考虑的主要因素。在创建的名为 video_example.avi 视频中，FOURCC 值为 XVID，视频文件格式为 AVI(*.avi)，同时最后，应设置视频每一帧的 FPS 和尺寸。
脚本 write_video_file.py 演示如何创建视频文件：

Import required packages

import cv2
import argparse

parser = argparse.ArgumentParser()

parser.add_argument(“output_video_path”, help=“path to the video file to write”)
args = parser.parse_args()

capture = cv2.VideoCapture(0)

frame_width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)
frame_height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)
fps = capture.get(cv2.CAP_PROP_FPS)

fourcc = cv2.VideoWriter_fourcc(*‘XVID’)

out_gray = cv2.VideoWriter(args.output_video_path, fourcc, int(fps), (int(frame_width), int(frame_height)), False)

while capture.isOpened():
ret, frame = capture.read()
if ret:
gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
out_gray.write(gray_frame)

cv2.imshow(‘gray’, gray_frame)

if cv2.waitKey(1) & 0xFF == ord(‘q’):
break
else:
break

capture.release()
out_gray.release()
cv2.destroyAllWindows()

在上例中，必需的参数是输出视频文件名(例如 video_example.avi)：

parser = argparse.ArgumentParser()
parser.add_argument(“output_video_path”, help=“path to the video file to write”)
args = parser.parse_args()

从连接到计算机的第一台相机拍摄视频画面。因此，首先创建对象：

capture = cv2.VideoCapture(0)

接下来，从 capture 对象中获取一些关键属性(帧宽度、帧高度和 FPS)，用于创建视频文件时使用：

frame_width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)
frame_height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)
fps = capture.get(cv2.CAP_PROP_FPS)

然后，使用四字节编码 FOURCC 指定视频编解码器，此处将编解码器定义为 XVID ：

fourcc = cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’)

也可以使用以下方式指定视频编码器：

fourcc = cv2.VideoWriter_fourcc(*‘XVID’)

然后，使用与输入相机相同的属性创建 cv2.VideoWriter 对象 out_gray，cv2.VideoWriter 的最后一个参数值是 False 表示以灰度方式写入视频。如果我们想创建彩色视频，最后一个参数值为 True ：

out_gray = cv2.VideoWriter(args.output_video_path, fourcc, int(fps), (int(frame_width), int(frame_height)), False)

使用 capture.read() 从 catpure 对象获取相机帧，每一帧都被转换成灰度并写入视频文件，如果按下 q 键，程序结束：

while capture.isOpened():
ret, frame = capture.read()
if ret:
gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
out_gray.write(gray_frame)
cv2.imshow(‘gray’, gray_frame)

if cv2.waitKey(1) & 0xFF == ord(‘q’):
break
else:
break

最后，释放所有内容(包括 cv2.VideoCapture 和 cv2.VideWriter 对象，并销毁创建的窗口)：

capture.release()
out_gray.release()
cv2.destroyAllWindows()

通过在命令行中执行以下命令，运行脚本：

python write_video_file.py video_example.avi

在工作目录下可以看到保存的灰度视频文件。

5. 视频属性详解

在上述示例中，我们已经了解了如何从 cv2.VideoCapture 对象中获取一些关键属性。接下来，将介绍所有属性并了解它们的工作原理。最后，我们将使用这些属性来加载视频文件并反向输出(首先显示视频的最后一帧，依此类推)。

5.1 获取视频对象的属性

创建 read_video_file_all_properties.py 脚本来显示所有属性。其中一些属性仅在使用相机时才有效(而在视频文件时无效)。
在脚本中，首先创建 decode_fourcc() 函数，它将 capture.get(cv2.CAP_PROP_FOURCC) 返回的 int 类型的值转换为表示编解码器的字符串值，来正确输出编解码器：

def decode_fourcc(fourcc):
fourcc_int = int(fourcc)

print(“int value of fourcc: ‘{}’”.format(fourcc_int))

fourcc_decode = “”
for i in range(4):
int_value = fourcc_int >> 8 * i & 0xFF
print(“int_value: ‘{}’”.format(int_value))
fourcc_decode += chr(int_value)

return fourcc_decode

下图解释了函数 decode_fourcc 的工作原理：

视频对象的属性

第一步是获取由 capture.get(cv2.CAP_PROP_FOURCC) 返回的值( int 表示的字符串)，然后，迭代四次，每次获取八位并将这八位转换为 int 。最后，使用 chr() 函数将这些 int 值转换为 char。也可以只使用一行代码就可以完成此功能：

return “”.join([chr((fourcc_int >> 8 * i) & 0xFF) for i in range(4)])

下表显示了视频文件的主要属性和解释：

视频属性	解释
CAP_PROP_POS_FRAMES	视频文件的当前帧
CAP_PROP_POS_MSEC	当前帧的时间戳
CAP_PROP_FPS	获取 FPS
CAP_PROP_FRAME_WODTH	视频帧的宽度
CAP_PROP_FRAME_HEIGHT	视频帧的高度
CAP_PROP_FRAME_COUNT	视频文件的总帧数

使用以下代码，可以获取和打印所有属性：

print(“CV_CAP_PROP_FRAME_WIDTH:‘{}’”.format(capture.get(cv2.CAP_PROP_FRAME_WIDTH)))
print(“CV_CAP_PROP_FRAME_HEIGHT :‘{}’”.format(capture.get(cv2.CAP_PROP_FRAME_HEIGHT)))
print(“CAP_PROP_FPS : ‘{}’”.format(capture.get(cv2.CAP_PROP_FPS)))
print(“CAP_PROP_POS_MSEC :‘{}’”.format(capture.get(cv2.CAP_PROP_POS_MSEC)))
print(“CAP_PROP_POS_FRAMES :‘{}’”.format(capture.get(cv2.CAP_PROP_POS_FRAMES)))
print(“CAP_PROP_FOURCC :‘{}’”.format(decode_fourcc(capture.get(cv2.CAP_PROP_FOURCC))))
print(“CAP_PROP_FRAME_COUNT :‘{}’”.format(capture.get(cv2.CAP_PROP_FRAME_COUNT)))
print(“CAP_PROP_MODE : ‘{}’”.format(capture.get(cv2.CAP_PROP_MODE)))
print(“CAP_PROP_BRIGHTNESS :‘{}’”.format(capture.get(cv2.CAP_PROP_BRIGHTNESS)))
print(“CAP_PROP_CONTRAST :‘{}’”.format(capture.get(cv2.CAP_PROP_CONTRAST)))
print(“CAP_PROP_SATURATION :‘{}’”.format(capture.get(cv2.CAP_PROP_SATURATION)))
print(“CAP_PROP_HUE : ‘{}’”.format(capture.get(cv2.CAP_PROP_HUE)))
print(“CAP_PROP_GAIN : ‘{}’”.format(capture.get(cv2.CAP_PROP_GAIN)))
print(“CAP_PROP_EXPOSURE :‘{}’”.format(capture.get(cv2.CAP_PROP_EXPOSURE)))
print(“CAP_PROP_CONVERT_RGB :‘{}’”.format(capture.get(cv2.CAP_PROP_CONVERT_RGB)))
print(“CAP_PROP_RECTIFICATION :‘{}’”.format(capture.get(cv2.CAP_PROP_RECTIFICATION)))
print(“CAP_PROP_ISO_SPEED :‘{}’”.format(capture.get(cv2.CAP_PROP_ISO_SPEED)))
print(“CAP_PROP_BUFFERSIZE :‘{}’”.format(capture.get(cv2.CAP_PROP_BUFFERSIZE)))

5.2 视频属性的使用——视频的反向播放

为例更好的了解如何使用上述属性，接下来，我们通过实战使用这些属性。编写 read_video_file_backwards.py 脚本，该脚本使用一些上述属性加载视频并反向播放(首先显示视频的最后一帧，然后播放倒数第二帧，依此类推)，为了实现此目的，需要使用属性：cv2.CAP_PROP_FRAME_COUNT 和 cv2.CAP_PROP_POS_FRAMES。

import cv2
import argparse

parser = argparse.ArgumentParser()
parser.add_argument(“video_path”, help=‘path to the video fiel’)
args = parser.parse_args()

capture = cv2.VideoCapture(args.video_path)

if capture.isOpened() is False:
print(“Error opening vieo stream or file”)

frame_index = capture.get(cv2.CAP_PROP_FRAME_COUNT) - 1
print(“Starting in frame: ‘{}’”.format(frame_index))

while capture.isOpened() and frame_index >= 0:
capture.set(cv2.CAP_PROP_POS_FRAMES, frame_index)
ret, frame = capture.read()

if ret:
cv2.imshow(‘Original frame’, frame)
frame_index = frame_index - 1
print(“next index to read: ‘{}’”.format(frame_index))

Press q on keyboard to exit the program:

if cv2.waitKey(25) & 0xFF == ord(‘q’):
break

Break the loop

else:
break

capture.release()
cv2.destroyAllWindows()

第一步是获取最后一帧的索引：

frame_index = capture.get(cv2.CAP_PROP_FRAME_COUNT) - 1

然后，将当前帧设置为所获取帧的位置：

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024c （备注python）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

x - 1
print(“next index to read: ‘{}’”.format(frame_index))

Press q on keyboard to exit the program:

if cv2.waitKey(25) & 0xFF == ord(‘q’):
break

Break the loop

else:
break

capture.release()
cv2.destroyAllWindows()

第一步是获取最后一帧的索引：

frame_index = capture.get(cv2.CAP_PROP_FRAME_COUNT) - 1

然后，将当前帧设置为所获取帧的位置：

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024c （备注python）
[外链图片转存中…(img-9HPjXvkR-1713709527794)]

冉静学习开发

关注

14
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
OpenCV-Python实战（2）——图像与视频文件的处理_pythonopencv处理视频

具体而言，编解码器可用于将未压缩的视频转换为压缩后的视频，或者可用于将压缩的视频转换为未压缩的视频。例如，如果算法需要跟踪和检测在街上行走的人，那么 15 FPS 可能就足够了。视频文件格式是一种用于存储数字视频数据的文件格式，典型的视频文件格式包括 AVI(*.avi)、MP4(*.mp4)、QuickTime(*.mov) 和 Windows Media Video(*.wmv)。视频中，FOURCC 值为 XVID，视频文件格式为 AVI(*.avi)，同时最后，应设置视频每一帧的 FPS 和尺寸。
复制链接

扫一扫