CVPR 2020 论文大盘点-动作识别篇

最新推荐文章于 2024-07-28 09:30:00 发布

OpenCV中文网公众号

最新推荐文章于 2024-07-28 09:30:00 发布

阅读量1.7k

点赞数 2

文章标签：计算机视觉机器学习人工智能深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bevison/article/details/109302691

版权

本文详细盘点了CVPR 2020年在动作识别领域的研究，强调了时空信息融合与无监督学习的进展。介绍了多篇论文，包括提出的新方法如时间金字塔网络、门控移位网络、无监督视频表示学习等，这些研究不仅提高了动作识别的精度，还关注了计算效率和数据效率。此外，还提到了用于动作识别的新数据集FineGym。

摘要由CSDN通过智能技术生成

format,png

本文盘点所有CVPR 2020 动作识别（Action Recognition ）相关论文，该方向也常被称为视频分类（Video Classification ）。从后面的名字可以看出该任务就是对含人体动作的视频进行分类。

（关于动作检测、分割、活动识别等方向将在后续文章整理）

该部分既包含基于普通视频的动作识别，也包含基于深度图和基于骨架的动作识别。

因为视频既包含空域信息，又包含时域信息，所以时空信息的融合、特征提取是该领域的重要方向。

因为视频往往数据量大，信息冗余，是典型的计算密集型任务,以往的方法往往（如3D CNN）计算代价很高，提高（训练/推断）速度也是不少论文研究的方向。

特别值得一提的是斯坦福大学、MIT、谷歌发表的两篇基于视频的无监督表示学习，不仅可用于动作识别，其可以看作为通用的视觉特征提取方法，相信会对未来的计算机视觉研究产生重要影响。

大家可以在：

http://openaccess.thecvf.com/CVPR2020.py

按照题目下载这些论文。

如果想要下载所有CVPR 2020论文，请点击这里：

CVPR 2020 论文全面开放下载，含主会和workshop

动作识别（Action Recognition）

细粒度动作识别的多模态域适应技术，使用RGB与光流数据，解决动作识别在不同数据集上训练和测试性能下降的问题。

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

作者 | Jonathan Munro, Dima Damen

单位 | 布里斯托大学

时间金字塔网络（TPN）用于动作识别，可方便“即插即用”到2D和3D网络中，显著改进动作识别的精度。

Temporal Pyramid Network for Action Recognition

作者 | Ceyuan Yang, Yinghao Xu, Jianping Shi, Bo Dai, Bolei Zhou

单位 | 香港中文大学；商汤

代码 | Temporal Pyramid Network for Action Recognition

主页 | https://decisionforce.github.io/TPN/

format,png

提出motion excitation (ME) 模块和 multiple temporal aggregation (MTA) 模块用于捕获短程和长程时域信息，提高动作识别的速度和精度。

TEA: Temporal Excitation and Aggregation for Action Recognition

作者 | Yan Li, Bin Ji, Xintian Shi, Jianguo Zhang, Bin Kang, Limin Wang

单位 | 腾讯；南京大学；南方科技大学

最低0.47元/天解锁文章

OpenCV中文网公众号

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。