双流网络——视频行为识别

Two-Stream Convolutional Networks for Action Recognition in Videos 论文链接

1.双流网络的贡献

  1. 提出了two-stream的卷积网络结构,由时间网络和空间网络组成;
  2. 证明了在多帧密集光流上训练的卷积网络,在有限的数据集上仍然能够获得好的性能;
  3. 使用多任务学习,应用了两种不同的动作分类的数据集,增加了训练集的数据量,并提高了性能。

2.双流网络结构

空间流输入的数据是每个帧的画面,也就是一个静态的图片,该输入描述的是单个帧的运动信息。
时间流输入的数据是多帧密集光流,多帧密集光流是几个连续帧之间堆叠光流位移场,该输入描述了帧之间的运动信息。

 图1. 双流网络结构
图1. 双流网络结构

如上图所示,双流网络的结构分为空间流卷积网络(Spatial Stream ConvNet)和时间流卷积网络(Temporal stream ConvNet)。两个网络的结构是一样的,都是由五个卷积层、两个全连接层和一层softmax组成.两层最后输出的数据结合在一起,结合的方法有平均法和SVM,经过试验验证SVM的结合方法效果较好。

2.1多帧密集光流(multi-frame op

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值