ST-GCN训练自己的数据集代码实践问题记录

最新推荐文章于 2024-08-16 09:12:47 发布

置顶小Aer

最新推荐文章于 2024-08-16 09:12:47 发布

阅读量5k

点赞数 12

分类专栏：计算机视觉cv 文章标签：深度学习 python st_gcn

本文链接：https://blog.csdn.net/qq_41542989/article/details/118975941

版权

计算机视觉cv 专栏收录该内容

11 篇文章 3 订阅

订阅专栏

文章目录

1. 下载代码和安装相应的环境
2. 构建数据集
3. 训练数据集
4. 测试数据集
5. 相关文章

1. 下载代码和安装相应的环境

【文末提供论文下载地址】
首先从open-mmalb/mmskeleton下载代码，然后在mmskeleton/doc/GETTING_STARTED.md中可以找到环境的安装步骤，主要是pytorch，python和cuda的版本一定要对上，可以参考我的另外一篇文章torch- torchvision- python版本对应关系和pytorch官网
在这里插入图片描述

2. 构建数据集

在这里我是自己构建的数据集，我将会就自己的过程进行总结。
首先官方文档mmskeleton/doc/CUSTOM_DATASET.md中给出了大概步骤，主要是对configs/utils/build_dataset_badminton.yaml，resource/category_annotation_example.json，mmskeleton/processor/skeleton_dataset.py进行了修改

2.1 configs/utils/build_dataset_example.yaml

在这里插入图片描述
video_dir 是指需要处理的动过识别片段
out_dir是指经过检测和姿态识别之后的输出路径
category_annotation是指视频和动作的关系对照

2.2 resource/category_annotation_example.json

在这里需要把需要识别的动作准备好，并且每个视频对应的标签都弄好
在这里插入图片描述

2.3 mmskeleton/processor/skeleton_dataset.py

在这个文件中，主要是build函数，主要实现了对原视频的处理以及骨架数据的保存过程

在这里插入图片描述

上图是build函数的内部处理最关键的部分，这个for循环是主要修改的部分，因为我们自己创建数据集的时候，原始图片路径，目标数据路径，视频的标签关系和保存格式等等都可以在这个for循环里面进行修改。

3. 训练数据集

执行语句：mmskl configs/recognition/st_gcn/dataset_example/train.yaml
修改通道是数目（2D为3，3D为4）,动作类别的数目，数据的目录，选取的最大置信度人的个数，关键点个数和训练过程中的日志文件、最后训练好的模型保存地址
（文件位置configs/recognition/st_gcn/dataset_example/train.yaml）

3.1 我是用的是2D数据，所以in_channels是3，同时类别数是13
在这里插入图片描述

3.2 data_dir是第二步准备数据集的时候，最好保存号的数据集目录，num_track是一帧中选取置信度最高的两个人的意思，num_keypoints是骨架的关键点数目，这个根据具体情况而定，我是按论文中的算法来的，所以还是17个关键点（要改两处地方，下面两张图）

在这里插入图片描述

3.3 最后日志文件和训练号的模型文件保存地址（可以自己更改），total_epochs是全部的训练批次
在这里插入图片描述

4. 测试数据集

执行语句：mmskl configs/recognition/st_gcn/dataset_example/test.yaml --checkpoint work_dir/recognition/st_gcn/[path of pth]/latest.pth

上面语句的最后[path of pth]是在3.3中设置的模型文件保存地址，下面是要修改的地方（文件位置configs/recognition/st_gcn/dataset_example/test.yaml）
在这里插入图片描述
data_dir是指要测试的数据集位置，其实之前都已经提过，就不再介绍了。