什么是视频数据，怎么处理视频数据

我的博客~

已于 2023-09-17 12:04:41 修改

阅读量677

点赞数 2

分类专栏：视频分类文章标签：音视频深度学习 python 视频

于 2023-09-16 15:30:03 首次发布

本文链接：https://blog.csdn.net/yuguolong_001/article/details/132918866

版权

视频分类专栏收录该内容

5 篇文章 0 订阅

订阅专栏

什么是视频数据

百度百科对于视频数据的定义：视频数据是指连续的图像序列，其实质是由一组组连续的图像构成的，而对于图像本身而言，除了其出现的先后顺序而外，没有任何结构信息。

视频数据有什么特点

1．信息内容丰富
        视频数据是随时间变化的图像流，含有更为丰富的其他媒体所无法表达的信息和内容。
2．数据量巨大
        视频数据的数据量比结构记录的文本数据大约大七个数量级。视频数据对存储空间和传输信道的要求很高，即使是一小段的视频剪辑，也需要比一般字符型数据大得多的存储空间。通常在管理视频数据时都要对其进行压缩编码，但是压缩后的视频数据量仍然很大。
3．时空二重性的复杂结构关系
        视频数据由多幅连续的图像序列构成，因而视频段之间的关系属性复杂，既有时间属性又有空间属性。

深度学习处理视频需要考虑什么

1. 图像分辨率

视频都由多张图像组成，图像的分辨率能代表视频质量的好坏（指清晰、和逼真程度）。分辨率越高存储的信息越多，占用的空间也就越大，训练需要的显卡资源也越多，考虑到资源的限制，我们一般会把单张的图片resize到224*224。

2. 视频的帧率

视频的帧率是指视频播放1秒时，播放量多少帧图像，假设一部影片的帧率是30fps，播放一秒钟视频就在屏幕上闪现了30张图像，60fps也同理。在训练过程中我们大概率不需要非常高的帧率，这时就需要手动做抽帧了（抽帧后数据量减少，有效缓解硬件压力）

图像分辨率和视频帧率是数据预处理时最先考虑的事情，拿到了这个数据我们就需要考虑使用少分辨率、多少帧率的数据进行标注、训练。

处理视频数据常用的库

我在工作中常用的视频处理库有opencv、numpy。opencv可以读取图像、视频数据，也能获取到图像的分辨率、帧率等信息，numpy主要是对数据做计算操作。

使用opencv加载视频数据

下面的代码主要作用：加载本地视频数据并播放

import cv2
video = cv2.VideoCapture('视频所在位置')


while True:
    # 读取图像
    retval ,frame = video.read()
    
    if retval == True:
        # 显示图像
        cv2.imshow('video',frame)
        cv2.waitKey(20)
    
    else:
        break
    
# 释放资源
video.release()
cv2.destroyAllWindows()