双流网络——视频行为识别

最新推荐文章于 2023-07-09 00:25:48 发布

qq_45649076

最新推荐文章于 2023-07-09 00:25:48 发布

阅读量2.1k

点赞数

文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45649076/article/details/120628972

版权

Two-Stream Convolutional Networks for Action Recognition in Videos 论文链接

1.双流网络的贡献

提出了two-stream的卷积网络结构，由时间网络和空间网络组成；
证明了在多帧密集光流上训练的卷积网络，在有限的数据集上仍然能够获得好的性能；
使用多任务学习，应用了两种不同的动作分类的数据集，增加了训练集的数据量，并提高了性能。

2.双流网络结构

空间流输入的数据是每个帧的画面，也就是一个静态的图片，该输入描述的是单个帧的运动信息。
时间流输入的数据是多帧密集光流，多帧密集光流是几个连续帧之间堆叠光流位移场，该输入描述了帧之间的运动信息。

图1. 双流网络结构

如上图所示,双流网络的结构分为空间流卷积网络（Spatial Stream ConvNet）和时间流卷积网络(Temporal stream ConvNet)。两个网络的结构是一样的，都是由五个卷积层、两个全连接层和一层softmax组成.两层最后输出的数据结合在一起，结合的方法有平均法和SVM,经过试验验证SVM的结合方法效果较好。

2.1多帧密集光流（multi-frame op

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
双流网络——视频行为识别

Two-Stream Convolutional Networks for Action Recognition in Videos 论文链接1.双流网络的贡献提出了two-stream的卷积网络结构，由时间网络和空间网络组成；证明了在多帧密集光流上训练的卷积网络，在有限的数据集上仍然能够获得好的性能；使用多任务学习，应用了两种不同的动作分类的数据集，增加了训练集的数据量，并提高了性能。2.双流网络结构空间流输入的数据是每个帧的画面，也就是一个静态的图片，该输入描述的是单个帧的运动信息。
复制链接

扫一扫

qq_45649076 CSDN认证博客专家 CSDN认证企业博客

码龄5年

8: 原创

52万+: 周排名

46万+: 总排名

20万+: 访问

: 等级

406: 积分

64: 粉丝

287: 获赞

16: 评论

1859: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇

最新评论

ResNet详解
DQYanZhixuan: 就是说每进行一次卷积就要接一次batchnormal吗
ResNet详解
葉子熊: 确实有点瑕疵，凑活看吧
ResNet详解
糕千千: 那这个网络是3d的还是2d的
ResNet详解
阿史那隼_Lynclock: 虚线部分的skip connection 卷积核尺寸为1x1的目的是因为该卷积层的目的是，只调整channel的维度，高和宽不变。如果既想要改变channel维度，又想改变长和宽，可以相应的改变卷积核滑窗步长，不需要改变卷积核尺寸。
ResNet详解
qq_49226030: 只是举个例子，如果输入通道数是256那么basic block就也是256×256.作者这里意思是对比同样通道数下参数的差距。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。