Learning Spatiotemporal Features with 3D Convolutional Networks译

最新推荐文章于 2022-01-05 21:06:28 发布

lixun187cm

最新推荐文章于 2022-01-05 21:06:28 发布

阅读量214

点赞数

文章标签：人工智能深度学习神经网络机器学习计算机视觉

本文链接：https://blog.csdn.net/lixun186cm/article/details/78744681

版权

摘要

我们提出了一个简单而有效的方法来进行时空特征学习使用深度三维卷积网络（3D ConvNets）在大规模监督视频数据集上训练。我们的研究结果有三个：

（1）3D ConvNets比2D ConvNets更适合于时空特征学习;

（2）在所有层中都使用一个包含有3x3x3小卷积核的相同结构是3D ConvNets最好的体系结构;
（3）我们用一个简单的线性分类器学到的特征（即C3D,Convolutional 3D）在4个不同的基准测试中胜过了最先进的方法，并且与其他2个基准测试中当前最好的方法相媲美。此外，这些特征是紧凑的：在UCF101数据集上仅有10个维度就可以达到52：8的精度，而且由于ConvNets的快速推理，计算也非常有效。最后，它们在概念上非常简单，易于训练和使用。

3.利用C3D学习特征

我忽然觉着，我应该练练英语进行直译的。。。算了，有空再更吧

PS.在线写东西弄格式真鸡儿费劲儿