[CVPR 2021] 利用时序差分进行动作识别的最新Backbone--TDN

最新推荐文章于 2023-07-23 13:47:32 发布

VIP文章半分热度

最新推荐文章于 2023-07-23 13:47:32 发布

阅读量1.3k

点赞数 3

分类专栏：暴恐检测文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41956697/article/details/120411707

版权

TDN: Temporal Difference Networks for Efficient Action Recognition

存在的问题

这是一篇动作识别方向的文章，之前的时空建模方法大致分为两种，一种是双流网络，一个RGB流一个光流，利用光流捕获运动信息，计算量很大；另一种方法是使用3D卷积，从RGB信息中隐式学习运动特征，但是3D卷积在时间维度缺乏特定的考虑（3D卷积学出来的时序weight的分布基本一致，更多的还是对时序上的信息做一种平滑聚合）且需要更多的算力。也有使用RGB Difference作为另一个输入，作为光流的替代品，训练不同的网络与RGB信息融合。

解决办法

作者提出Temporal Difference Network(TDN)，来提取多尺寸的时间信息（multi-scale temporal information），TDN作为一个统一的框架来联合捕获RGB和运动信息，通过将时间差异的思想概括为端到端网络的有原则且高效的时间模块。之前有双流（RGB+帧差），我理解的是作者将帧差这一流改成了一个框架（大致思想和帧差类似），并且可以提取短时和长时两种特征来增强信息。
作者认为短期和长期时间信息对于动作识别都至关重要，

最低0.47元/天解锁文章

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
[CVPR 2021] 利用时序差分进行动作识别的最新Backbone--TDN

TDN: Temporal Difference Networks for Efficient Action RecognitionarxivGithub存在的问题这是一篇动作识别方向的文章，之前的时空建模方法大致分为两种，一种是双流网络，一个RGB流一个光流，利用光流捕获运动信息，计算量很大；另一种方法是使用3D卷积，从RGB信息中隐式学习运动特征，但是3D卷积在时间维度缺乏特定的考虑（3D卷积学出来的时序weight的分布基本一致，更多的还是对时序上的信息做一种平滑聚合）且需要更多的算力。也有使
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。