前言:
由于项目需要,所以打算复现《StNet:Local and Global Spatial-Temporal Modeling for Human Action Recognition》这一篇论文,鉴于踩过的一些坑,特此记录下。
项目链接:https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/video/models/stnet/README.md
准备
环境:ubuntu16.04+paddlepaddle
数据集修正
首先来讲下数据处理,这里百度文档使用的是Kinectics-400,虽然文档中也有提供下载,但是不知道为什么,我使用官方的链接无法下载,所以我从网上找了一个链接,感谢https://blog.csdn.net/zugexiaodui/article/details/103598326这个博客的作者,大家如果有尝试官方不成功的可以尝试此方法,不过此方法下载的数据集存在一些问题,特此