基于PaddlePaddle复现Representation Flow之论文阅读笔记

这篇笔记详述了阅读论文'Representation Flow for Action Recognition'的体会,指出其提出的光流表示层能有效提升视频动作识别效率。论文提出的方法包括:1) 一种TV-L1光流计算的网络层;2) 光流层可在CNN特征图后插入,不需与RGB融合。实验证明,在第一层和第四层CNN之间加入光流层效果最佳,而堆叠多个光流层不如插入卷积层。作者计划用PaddlePaddle框架复现此论文结果。
摘要由CSDN通过智能技术生成

介绍:
本阅读笔记是为百度论文复现营准备的针对论文“Representation Flow for Action Recognition“的阅读笔记。

解决的问题:
论文主要针对视频理解的场景解决了两个问题:
1。 传统的光流计算方法效率低,且传统光流图不一定能有效表征视频帧中的动作信息。
2。 已经存在的光流计算网络只能接收传统的RGB帧。

提出的方案:
一种称为光流表示层的网络,实现了TV-L1光流计算方法。

论文的效果体现在两个方面:

  1. 可以快速的提取动作表示,计算时间比传统方法高效。
  2. 可以用在CNN特征图后,可以灵活的在网络中放置光流层,并且可以不需要和RGB层融合而直接进行判别输出。

光流表示层网络结构如图1所示。
光流表示层在视频理解网络中的位置如图2所示。

光流表示层网络结构
光流表示层在视频理解网络中的位置

有价值的建议:

  1. 在网络的哪一层使用光流层。作者发现,在第一层CNN和第四层CNN之间使用光流层效果较好。
  2. 多个光流层堆叠效果不好,但是在两个光流层间加一个卷积层效果反而会更好。
  3. 对于光流层施加光流层可以判别相同动作出现的位置,即flow of flow的概念。

感想:
作者提出的光流表示层作为一个模块,在各种需要使用光流

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值