TSN实验过程

最新推荐文章于 2024-05-14 11:00:23 发布

VIP文章 qq_39862223

最新推荐文章于 2024-05-14 11:00:23 发布

阅读量7.5k

点赞数 6

分类专栏： tsn 文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/qq_39862223/article/details/108461526

版权

1.数据准备阶段

在视频分类项目中，有很多经典的公开数据集，目前主要的数据集如列表所示：

本次TSN实验复现使用的是UCF101数据集。

UCF101是动作识别数据集，从Youtube收集而得，共包含101类动作。其中每类动作由25个人做动作，每人做4-7组，共13320个视频，分辨率为320*240。UCF101在动作的采集上具有非常大的多样性，包括相机运行、外观变化、姿态变化、物体比例变化、背景变化、光纤变化等。

101类动作可以分为5类：人与物体互动、人体动作、人与人互动、乐器演奏、体育运动。

在这里插入图片描述

下载成功后的UCF文件夹如下所示：
该文件夹下是各种动作的视频文件，共有101种类别
在这里插入图片描述
下图是UCF101在进行训练和测试时，分割的依据文件

在实验过程中，我们需要使用tsn-pytorch和mmaction的一些代码文件，所以我们提前从Git上获得存储在本地。

git clone --recursive https://github.com/open-mmlab/mmaction.git

git clone --recursive https://github.com/yjxiong/tsn-pytorch

在我们下载好的UCF101数据集中，视频大多是长时间的，很难对其进行动作识别，所以需要进行提帧操作。
首先在mmaction的data/ucf101中创建rawframes、videos、annotations文件夹。

然后在mmaction/data_tools/build_rawframes.py 就是进行视频提帧的代码文件，输入命令如下所示：

python build_rawframes.py ../data/ucf101/videos ../data/ucf101/rawframes/ --level 2  --ext avi

命令行窗口：
在这里插入图片描述

生成的文件目录形式如下所示：

关注