这是Du Tran在Learning Spatiotemporal Features with 3D Convolutional Networks之后发表的续篇,相当于C3D的第二个版本,C3D-resnet.我个人觉得这篇文章除了主要探讨C3D-resnet以外,更重要的是对CNN卷积结构在时空特征表现上的一个深入探讨。大部分工作还是基于UCF-101,而且从头训练,很利于在硬件条件有限的情况下,对算法进行讨论。
首先给出代码:
https://github.com/facebook/C3D/tree/master/C3D-v1.1
再看一下升级后的效果图:
这是相较于C3D来说,已经有了明显的提高。
接下来我们看一下3D Residual Networks的结构
这是一个标准的8×112×112的input的结构。
论文笔记--ConvNet Architecture Search for Spatiotemporal Feature Learning
最新推荐文章于 2023-04-26 14:35:34 发布