opencv-python 5.视频-CSDN博客

目标

学会读取视频文件，显示视频，保存视频文件
学会从摄像头获取并显示视频
你将会学习到这些函数：cv2.VideoCapture()，cv2.VideoWrite()

5.1 用摄像头捕获视频

我们经常需要使用摄像头捕获实时图像。OpenCV 为这中应用提供了一个非常简单的接口。让我们使用摄像头来捕获一段视频，并把它转换成灰度视频显示出来。从这个简单的任务开始吧。

为了获取视频，你应该创建一个VideoCapture 对象。他的参数可以是设备的索引号，或者是一个视频文件。设备索引号就是在指定要使用的摄像头。一般的笔记本电脑都有内置摄像头。所以参数就是0。你可以通过设置成1 或者其他的来选择别的摄像头。之后，你就可以一帧一帧的捕获视频了。但是最后，别忘了停止捕获视频。

import cv2 as cv

cap = cv.VideoCapture(0)

while (True):
    # Capture frame-by-frame
    ret, frame = cap.read()

    #Our operations on the frame come here
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)

    #Display the resulting frame
    cv.imshow('frame', gray)
    if cv.waitKey(1) == ord('q'):
        break

#When everything done, release the capture
cap.release()
cv.destroyAllWindows()

结果：
在这里插入图片描述

代码解释：

cv2.VideoCapture() 创建了一个VideoCapture对象，用来捕获视频。它的参数可以是设备的索引号，或是一个视频文件。设备的索引号是指定要用的摄像头，一般内置的摄像头的索引号为0，可以换成1或其他的数字调用其他的摄像头。

因为视频是一帧一帧获取的，所以接下来是个一个while True 循环，循环读取每一帧。

ret, frame = cap.read()读取每一帧，其中ret表示一个True/False的布尔值，用来表示是否读取成功。frame表示读取到的np.array类型的每一帧，就是图片。

cv2.imshow(‘frame’,frame)将每一帧显示在一个叫frame的窗口上。这里解释一下，为什么这样显示在窗口上会产生视频的效果。前面操作图片的时候，我们提到过，显示多幅图像的时候，若cv2.imshow() 指定相同的窗口名，这样后面显示的图片会覆盖前面的图片，而产生一个窗口。这里视频显示也是同样的道理，每次while循环，窗口’frame’的名字不变，这样每一帧会覆盖上一帧，就产生了视频的效果。

if cv2.waitKey(1)== ord(‘q’):break 这里程序会等一毫秒，只要用户没有按下’q’键，程序就会执行下一个循环，若按下了’q’键，则程序会break跳出while循环。这里可以通过改变cv2.waitKey()里面的时间参数，来改变视频的播放速度。

cap.release()和cv2.destroyAllWindows()是用来停止捕获视频和关闭相应的显示窗口的。

补充：
有时cv2.VideoCapture()可能不能成功的初始化摄像头设备。这种情况下代码会报错。你可以使用 cap.isOpened()，来检查是否成功初始化了。如果返回值是 True，那就没有问题。否则就要使用函数 cap.open()。这是while True可以改为 while cap.isOpened()。

函数 cap.get(propId) 可以用来获得视频的一些参数信息。这里 propId 可以是 0 到 18 之间的任何整数。每一个数代表视频的一个属性：

• CV_CAP_PROP_POS_MSEC Current position of the video file in milliseconds.

（0-视频文件的当前位置（毫秒））
• CV_CAP_PROP_POS_FRAMES 0-based index of the frame to be decoded/captured next.

（1-下一步要解码/捕获的帧的基于0的索引）
• CV_CAP_PROP_POS_AVI_RATIO Relative position of the video file: 0 - start of the film, 1 - end of the film.

（2-视频文件的相对位置：0-胶片开始，1-胶片结束）
• CV_CAP_PROP_FRAME_WIDTH Width of the frames in the video stream.

（3-视频流中帧的宽度）
• CV_CAP_PROP_FRAME_HEIGHT Height of the frames in the video stream.

（4-视频流中帧的高度）
• CV_CAP_PROP_FPS Frame rate.

（5-帧率）
• CV_CAP_PROP_FOURCC 4-character code of codec.

（6-编解码器的4字符代码）
• CV_CAP_PROP_FRAME_COUNT Number of frames in the video file.

（7-视频文件中的帧数。）
• CV_CAP_PROP_FORMAT Format of the Mat objects returned by retrieve() .

（8-返回mat对象的格式）
• CV_CAP_PROP_MODE Backend-specific value indicating the current capture mode.

（9-后端特定值，指示当前捕获模式）
• CV_CAP_PROP_BRIGHTNESS Brightness of the image (only for cameras).

（10-图像的亮度–仅适用于相机）
• CV_CAP_PROP_CONTRAST Contrast of the image (only for cameras).

（11-对比度–仅用于相机）
• CV_CAP_PROP_SATURATION Saturation of the image (only for cameras).

（12-饱和度–仅用于相机）
• CV_CAP_PROP_HUE Hue of the image (only for cameras).

（13-色调–仅用于相机）
• CV_CAP_PROP_GAIN Gain of the image (only for cameras).

（14-增益–仅用于相机）
• CV_CAP_PROP_EXPOSURE Exposure (only for cameras).

（15-曝光–仅用于相机）
• CV_CAP_PROP_CONVERT_RGB Boolean flags indicating whether images should be converted to RGB.

（16-布尔标志，指示是否应将图像转换为RGB。）
• CV_CAP_PROP_WHITE_BALANCE Currently unsupported

（17-当前不受支持）
• CV_CAP_PROP_RECTIFICATION Rectification flag for stereo cameras (note: only supported by DC1394 v 2.x backend currently)

（18-立体摄像机的校正标志（注：目前仅受DC1394 v 2.x后端支持））

对应的，使用 cap.set(propId,value) 来修改视频属性，value 就是你想要设置成的新值。

例如，我可以使用cap.get(3) 和cap.get(4) 来查看每一帧的宽和高。默认情况下得到的值是640X480。但是我可以使用ret=cap.set(3,320)和ret=cap.set(4,240) 来把宽和高改成320X240。

注意：当你的程序报错时，你首先应该检查的是你的摄像头是否能够在其他程序中正常工作

5.2 从文件中播放视频

与从摄像头中捕获一样，你只需要把设备索引号改成视频文件的名字。在播放每一帧时，使用cv2.waitKey() 设置适当的持续时间。如果设置的太低视频就会播放的非常快，如果设置的太高就会播放的很慢（你可以使用这种方法控制视频的播放速度）。通常情况下25 毫秒就可以了。

import cv2 as cv

cap = cv.VideoCapture('I:/1.mp4')

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:

        cv.imshow('frame', frame)
        if cv.waitKey(30) == ord('q'):
            break
    else:
        break

#Release everything if job is finished
cap.release()
cv.destroyAllWindows()

5.3 保存视频

在我们捕获视频，并对每一帧都进行加工之后我们想要保存这个视频。对于图片来时很简单只需要使用cv2.imwrite()。但对于视频来说就要多做点工作。

这次我们要创建一个VideoWriter 的对象。我们应该确定一个输出文件的名字。接下来指定FourCC 编码（下面会介绍）。播放频率和帧的大小也都需要确定。最后一个是isColor 标签。如果是True，每一帧就是彩色图，否则就是灰度图。

FourCC 就是一个4 字节码，用来确定视频的编码格式。可用的编码列表可以从fourcc.org查到。这是平台依赖的。这是平台依赖的。下面这些编码器对我来说是有用个。

In Fedora: DIVX, XVID, MJPG, X264, WMV1, WMV2. (XVID is more preferable. MJPG results in high size video. X264 gives very small size video)
In Windows: DIVX (More to be tested and added)
In OSX : (I don’t have access to OSX. Can some one fill this?)

FourCC 码以下面的格式传给程序，以MJPG 为例：
cv2.cv.FOURCC(‘M’,‘J’,‘P’,‘G’) 或者cv2.cv.FOURCC(*‘MJPG’)。

下面的代码是从摄像头中捕获视频，，沿水平方向旋转每一帧并保存它为output.avi。（倒置）

import cv2 as cv

cap = cv.VideoCapture(0)

#Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi', fourcc, 20.0, (640,480))

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:
        frame = cv.flip(frame, 0)

        #write the flipped frame
        out.write(frame)

        cv.imshow('frame', frame)
        if cv.waitKey(1) == ord('q'):
            break
    else:
        break

#Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()