CVPR 2020 论文大盘点-动作识别篇

本文详细盘点了CVPR 2020年在动作识别领域的研究,强调了时空信息融合与无监督学习的进展。介绍了多篇论文,包括提出的新方法如时间金字塔网络、门控移位网络、无监督视频表示学习等,这些研究不仅提高了动作识别的精度,还关注了计算效率和数据效率。此外,还提到了用于动作识别的新数据集FineGym。
摘要由CSDN通过智能技术生成

format,png

本文盘点所有CVPR 2020 动作识别(Action Recognition )相关论文,该方向也常被称为视频分类(Video Classification )。从后面的名字可以看出该任务就是对含人体动作的视频进行分类。

(关于动作检测、分割、活动识别等方向将在后续文章整理)

该部分既包含基于普通视频的动作识别,也包含基于深度图和基于骨架的动作识别。

因为视频既包含空域信息,又包含时域信息,所以时空信息的融合、特征提取是该领域的重要方向。

因为视频往往数据量大,信息冗余,是典型的计算密集型任务,以往的方法往往(如3D CNN)计算代价很高,提高(训练/推断)速度也是不少论文研究的方向。

特别值得一提的是斯坦福大学、MIT、谷歌发表的两篇基于视频的无监督表示学习,不仅可用于动作识别,其可以看作为通用的视觉特征提取方法,相信会对未来的计算机视觉研究产生重要影响。

大家可以在:

http://openaccess.thecvf.com/CVPR2020.py

按照题目下载这些论文。

如果想要下载所有CVPR 2020论文,请点击这里:

CVPR 2020 论文全面开放下载,含主会和workshop

动作识别(Action Recognition)

细粒度动作识别的多模态域适应技术,使用RGB与光流数据,解决动作识别在不同数据集上训练和测试性能下降的问题。

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

作者 | Jonathan Munro, Dima Damen

单位 | 布里斯托大学

时间金字塔网络(TPN)用于动作识别,可方便“即插即用”到2D和3D网络中,显著改进动作识别的精度。

Temporal Pyramid Network for Action Recognition

作者 | Ceyuan Yang, Yinghao Xu, Jianping Shi, Bo Dai, Bolei Zhou

单位 | 香港中文大学;商汤

代码 | Temporal Pyramid Network for Action Recognition

主页 | https://decisionforce.github.io/TPN/

format,png

提出motion excitation (ME) 模块 和 multiple temporal aggregation (MTA) 模块用于捕获短程和长程时域信息,提高动作识别的速度和精度。

TEA: Temporal Excitation and Aggregation for Action Recognition

作者 | Yan Li, Bin Ji, Xintian Shi, Jianguo Zhang, Bin Kang, Limin Wang

单位 | 腾讯;南京大学;南方科技大学

format,png

提取视频特征往往需要计算

  • 2
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值