目录
介绍
对视频数据的处理是计算机视觉领域非常重要的一部分内容。视频主要是由大量的视频帧图像所构成。相比于单一的图像,视频中多出了时间维度的信息,物体在先后帧中出现的顺序和状态等信息都非常关键。同时视频数据的数据量更大,而且相邻帧间差距较小,使得数据冗余度较高。所以在视频任务中,如何处理好时序信息、如何高效提取特征都是至关重要的问题。
本教程通过实例来介绍和实现一个简单的视频动作分类方法。本教程通过加载和预处理数据、构造和提取特征、训练分类器得到一个可以应用的视频动作分类工具。
任务描述
视频动作分类任务是根据一段视频信息判别出视频中主要出现的动作类别。这是一个典型的分类任务。
例如当给出如下篮球视频,就希望模型能够给出打篮球这样的动作分类,或是输出该动作在数据集映射表中的编号。
数据集
本次我们使用的数据集是精简版的UCF101数据集,可以在这里下载: