论文笔记:Representation Flow for Action Recognition 【飞桨】【PaddlePaddle】【论文复现】

本文介绍了一种用于视频动作识别的新型卷积层——Representation Flow Layer,它受TV-L1算法启发,完全可微,替代传统光流提取运动特征。实验表明,将该层置于网络第三块中,既提高了速度,又保持了高精度,超越基于光流的方法。
摘要由CSDN通过智能技术生成

简介

这是paddle论文复现课程推荐的cvpr2019的一篇视频分类论文。继TSN之后,很多视频分类算法开始使用光流信息来建模运动信息,获得了不错的精度的同时,速度受到了一定的影像。本篇文章提出使用神经网络来建模运动,替代传统的光流,从而实现一个更快的速度。
在这里插入图片描述

方法

本文提出了一个完全可微的卷积层,称作representation flow layer,来代替光流提取特征,并且所有的参数都可以端到端学习。

本文提出的卷积层受TV-L1算法启发设计,TV-L1算法的介绍可以参考知乎大佬的帖子

在TV-L1的基础上,本文的算法去掉了多尺度的计算和warp的过程,从而加快迭代进度。此外,TV-L1公式中的参数都是可以通过端到端的学习得到的,迭代的过程完全可微,因此可以把representation flow layer嵌入到网络的任意一层中。

最终,本文通过实验证明把representation flow layer放在第三个block计算表示流效果最佳,网络结构如图所示:
在这里插入图片描述

其中,representation flow layer的算法如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值