opencv-python 5.视频

目标

  • 学会读取视频文件,显示视频,保存视频文件
  • 学会从摄像头获取并显示视频
  • 你将会学习到这些函数:cv2.VideoCapture(),cv2.VideoWrite()

5.1 用摄像头捕获视频

我们经常需要使用摄像头捕获实时图像。OpenCV 为这中应用提供了一个非常简单的接口。让我们使用摄像头来捕获一段视频,并把它转换成灰度视频显示出来。从这个简单的任务开始吧。

为了获取视频,你应该创建一个VideoCapture 对象。他的参数可以是设备的索引号,或者是一个视频文件。设备索引号就是在指定要使用的摄像头。一般的笔记本电脑都有内置摄像头。所以参数就是0。你可以通过设置成1 或者其他的来选择别的摄像头。之后,你就可以一帧一帧的捕获视频了。但是最后,别忘了停止捕获视频。

import cv2 as cv

cap = cv.VideoCapture(0)

while (True):
    # Capture frame-by-frame
    ret, frame = cap.read()

    #Our operations on the frame come here
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    #Display the resulting frame
    cv.imshow('frame', gray)
    if cv.waitKey(1) == ord('q'):
        break

#When everything done, release the capture
cap.release()
cv.destroyAllWindows()

结果:
在这里插入图片描述

代码解释:

cv2.VideoCapture() 创建了一个VideoCapture对象,用来捕获视频。它的参数可以是设备的索引号,或是一个视频文件。设备的索引号是指定要用的摄像头,一般内置的摄像头的索引号为0,可以换成1或其他的数字调用其他的摄像头。

因为视频是一帧一帧获取的,所以接下来是个一个while True 循环,循环读取每一帧。

ret, frame = cap.read()读取每一帧,其中ret表示一个True/False的布尔值,用来表示是否读取成功。frame表示读取到的np.array类型的每一帧,就是图片。

cv2.imshow(‘frame’,frame)将每一帧显示在一个叫frame的窗口上。这里解释一下,为什么这样显示在窗口上会产生视频的效果。前面操作图片的时候,我们提到过,显示多幅图像的时候,若cv2.imshow() 指定相同的窗口名,这样后面显示的图片会覆盖前面的图片,而产生一个窗口。这里视频显示也是同样的道理,每次while循环,窗口’frame’的名字不变,这样每一帧会覆盖上一帧,就产生了视频的效果。

if cv2.waitKey(1)== ord(‘q’):break 这里程序会等一毫秒,只要用户没有按下’q’键,程序就会执行下一个循环,若按下了’q’键,则程序会break跳出while循环。这里可以通过改变cv2.waitKey()里面的时间参数,来改变视频的播放速度。

cap.release()和cv2.destroyAllWindows()是用来停止捕获视频和关闭相应的显示窗口的。

补充:
有时cv2.VideoCapture()可能不能成功的初始化摄像头设备。这种情况下代码会报 错。你可以使用 cap.isOpened(),来检查是否成功初始化了。如果返回值是 True,那就没有问题。否则就要使用函数 cap.open()。这是while True可以改为 while cap.isOpened()。

函数 cap.get(propId) 可以用来获得视频的一些参数信息。这里 propId 可以是 0 到 18 之间的任何整数。每一个数代表视频的一个属性:

• CV_CAP_PROP_POS_MSEC Current position of the video file in milliseconds.

(0-视频文件的当前位置(毫秒))
• CV_CAP_PROP_POS_FRAMES 0-based index of the frame to be decoded/captured next.

(1-下一步要解码/捕获的帧的基于0的索引)
• CV_CAP_PROP_POS_AVI_RATIO Relative position of the video file: 0 - start of the film, 1 - end of the film.

(2-视频文件的相对位置:0-胶片开始,1-胶片结束)
• CV_CAP_PROP_FRAME_WIDTH Width of the frames in the video stream.

(3-视频流中帧的宽度)
• CV_CAP_PROP_FRAME_HEIGHT Height of the frames in the video stream.

(4-视频流中帧的高度)
• CV_CAP_PROP_FPS Frame rate.

(5-帧率)
• CV_CAP_PROP_FOURCC 4-character code of codec.

(6-编解码器的4字符代码)
• CV_CAP_PROP_FRAME_COUNT Number of frames in the video file.

(7-视频文件中的帧数。)
• CV_CAP_PROP_FORMAT Format of the Mat objects returned by retrieve() .

(8-返回mat对象的格式)
• CV_CAP_PROP_MODE Backend-specific value indicating the current capture mode.

(9-后端特定值,指示当前捕获模式)
• CV_CAP_PROP_BRIGHTNESS Brightness of the image (only for cameras).

(10-图像的亮度–仅适用于相机)
• CV_CAP_PROP_CONTRAST Contrast of the image (only for cameras).

(11-对比度–仅用于相机)
• CV_CAP_PROP_SATURATION Saturation of the image (only for cameras).

(12-饱和度–仅用于相机)
• CV_CAP_PROP_HUE Hue of the image (only for cameras).

(13-色调–仅用于相机)
• CV_CAP_PROP_GAIN Gain of the image (only for cameras).

(14-增益–仅用于相机)
• CV_CAP_PROP_EXPOSURE Exposure (only for cameras).

(15-曝光–仅用于相机)
• CV_CAP_PROP_CONVERT_RGB Boolean flags indicating whether images should be converted to RGB.

(16-布尔标志,指示是否应将图像转换为RGB。)
• CV_CAP_PROP_WHITE_BALANCE Currently unsupported

(17-当前不受支持)
• CV_CAP_PROP_RECTIFICATION Rectification flag for stereo cameras (note: only supported by DC1394 v 2.x backend currently)

(18-立体摄像机的校正标志(注:目前仅受DC1394 v 2.x后端支持))

对应的,使用 cap.set(propId,value) 来修改视频属性,value 就是你想要设置成的新值。

例如,我可以使用cap.get(3) 和cap.get(4) 来查看每一帧的宽和高。默认情况下得到的值是640X480。但是我可以使用ret=cap.set(3,320)和ret=cap.set(4,240) 来把宽和高改成320X240。

注意:当你的程序报错时,你首先应该检查的是你的摄像头是否能够在其他程序中正常工作


5.2 从文件中播放视频

与从摄像头中捕获一样,你只需要把设备索引号改成视频文件的名字。在播放每一帧时,使用cv2.waitKey() 设置适当的持续时间。如果设置的太低视频就会播放的非常快,如果设置的太高就会播放的很慢(你可以使用这种方法控制视频的播放速度)。通常情况下25 毫秒就可以了。

import cv2 as cv

cap = cv.VideoCapture('I:/1.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:

        cv.imshow('frame', frame)
        if cv.waitKey(30) == ord('q'):
            break
    else:
        break

#Release everything if job is finished
cap.release()
cv.destroyAllWindows()

5.3 保存视频

在我们捕获视频,并对每一帧都进行加工之后我们想要保存这个视频。对于图片来时很简单只需要使用cv2.imwrite()。但对于视频来说就要多做点工作。

这次我们要创建一个VideoWriter 的对象。我们应该确定一个输出文件的名字。接下来指定FourCC 编码(下面会介绍)。播放频率和帧的大小也都需要确定。最后一个是isColor 标签。如果是True,每一帧就是彩色图,否则就是灰度图。

FourCC 就是一个4 字节码,用来确定视频的编码格式。可用的编码列表可以从fourcc.org查到。这是平台依赖的。这是平台依赖的。下面这些编码器对我来说是有用个。

  • In Fedora: DIVX, XVID, MJPG, X264, WMV1, WMV2. (XVID is more preferable. MJPG results in high size video. X264 gives very small size video)
  • In Windows: DIVX (More to be tested and added)
  • In OSX : (I don’t have access to OSX. Can some one fill this?)

FourCC 码以下面的格式传给程序,以MJPG 为例:
cv2.cv.FOURCC(‘M’,‘J’,‘P’,‘G’) 或者cv2.cv.FOURCC(*‘MJPG’)。

下面的代码是从摄像头中捕获视频,,沿水平方向旋转每一帧并保存它为output.avi。(倒置)

import cv2 as cv

cap = cv.VideoCapture(0)

#Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi', fourcc, 20.0, (640,480))

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:
        frame = cv.flip(frame, 0)

        #write the flipped frame
        out.write(frame)

        cv.imshow('frame', frame)
        if cv.waitKey(1) == ord('q'):
            break
    else:
        break

#Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()

代码解析:
cv2.VideoWriter_fourcc(FourCC) 参数FourCC 就是一个 4 字节码,用来确定视频的编码格式。

cv2.VideoWriter()创建一个 VideoWriter 的对象。参数一:一个输出文件的名字;参数二:FourCC 编码;参数三:播放频率;参数四:帧的大小(视频的长和宽);参数五:是否为彩色,True为彩色,False为灰度。

接下来while循环里就是读取每一帧,再向目标写入每一帧了

视频旋转cv2.flip(frame, 1)第一个参数表示要旋转的视频,第二个参数表示旋转的方向,0表示绕x轴旋转,大于0的数表示绕y轴旋转,小于0的负数表示绕x和y轴旋转。

cv2.flip(frame, 0)会出现视频输出倒置

最后三行是关闭读取操作,写入操作和相应的显示窗口。


自己做了点笔记
参考:
https://www.cnblogs.com/StarZhai/p/11905818.html
https://www.jianshu.com/p/0d3f9d05e1d0
大部分来自OpenCV-Python-Tutorial-中文版pdf 段力辉 译

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值