基于PaddlePaddle复现Representation Flow之论文阅读笔记

最新推荐文章于 2024-09-14 16:23:11 发布

wienparis

最新推荐文章于 2024-09-14 16:23:11 发布

阅读量231

点赞数

文章标签：人工智能 paddlepaddle 视频处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wienparis/article/details/107847201

版权

这篇笔记详述了阅读论文'Representation Flow for Action Recognition'的体会，指出其提出的光流表示层能有效提升视频动作识别效率。论文提出的方法包括：1) 一种TV-L1光流计算的网络层；2) 光流层可在CNN特征图后插入，不需与RGB融合。实验证明，在第一层和第四层CNN之间加入光流层效果最佳，而堆叠多个光流层不如插入卷积层。作者计划用PaddlePaddle框架复现此论文结果。

摘要由CSDN通过智能技术生成

介绍：
本阅读笔记是为百度论文复现营准备的针对论文“Representation Flow for Action Recognition“的阅读笔记。

解决的问题：
论文主要针对视频理解的场景解决了两个问题：
1。传统的光流计算方法效率低，且传统光流图不一定能有效表征视频帧中的动作信息。
2。已经存在的光流计算网络只能接收传统的RGB帧。

提出的方案：
一种称为光流表示层的网络，实现了TV-L1光流计算方法。

论文的效果体现在两个方面：

可以快速的提取动作表示，计算时间比传统方法高效。
可以用在CNN特征图后，可以灵活的在网络中放置光流层，并且可以不需要和RGB层融合而直接进行判别输出。

光流表示层网络结构如图1所示。
光流表示层在视频理解网络中的位置如图2所示。

光流表示层网络结构
光流表示层在视频理解网络中的位置

有价值的建议：

在网络的哪一层使用光流层。作者发现，在第一层CNN和第四层CNN之间使用光流层效果较好。
多个光流层堆叠效果不好，但是在两个光流层间加一个卷积层效果反而会更好。
对于光流层施加光流层可以判别相同动作出现的位置，即flow of flow的概念。

感想：
作者提出的光流表示层作为一个模块，在各种需要使用光流

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。