本文盘点所有CVPR 2020 动作识别(Action Recognition )相关论文,该方向也常被称为视频分类(Video Classification )。从后面的名字可以看出该任务就是对含人体动作的视频进行分类。
(关于动作检测、分割、活动识别等方向将在后续文章整理)
该部分既包含基于普通视频的动作识别,也包含基于深度图和基于骨架的动作识别。
因为视频既包含空域信息,又包含时域信息,所以时空信息的融合、特征提取是该领域的重要方向。
因为视频往往数据量大,信息冗余,是典型的计算密集型任务,以往的方法往往(如3D CNN)计算代价很高,提高(训练/推断)速度也是不少论文研究的方向。
特别值得一提的是斯坦福大学、MIT、谷歌发表的两篇基于视频的无监督表示学习,不仅可用于动作识别,其可以看作为通用的视觉特征提取方法,相信会对未来的计算机视觉研究产生重要影响。
大家可以在:
http://openaccess.thecvf.com/CVPR2020.py
按照题目下载这些论文。
如果想要下载所有CVPR 2020论文,请点击这里:
CVPR 2020 论文全面开放下载,含主会和workshop
动作识别(Action Recognition)
细粒度动作识别的多模态域适应技术,使用RGB与光流数据,解决动作识别在不同数据集上训练和测试性能下降的问题。
Multi-Modal Domain Adaptation for Fine-Grained Action Recognition
作者 | Jonathan Munro, Dima Damen
单位 | 布里斯托大学
时间金字塔网络(TPN)用于动作识别,可方便“即插即用”到2D和3D网络中,显著改进动作识别的精度。
Temporal Pyramid Network for Action Recognition
作者 | Ceyuan Yang, Yinghao Xu, Jianping Shi, Bo Dai, Bolei Zhou
单位 | 香港中文大学;商汤
代码 | Temporal Pyramid Network for Action Recognition
主页 | https://decisionforce.github.io/TPN/
提出motion excitation (ME) 模块 和 multiple temporal aggregation (MTA) 模块用于捕获短程和长程时域信息,提高动作识别的速度和精度。
TEA: Temporal Excitation and Aggregation for Action Recognition
作者 | Yan Li, Bin Ji, Xintian Shi, Jianguo Zhang, Bin Kang, Limin Wang
单位 | 腾讯;南京大学;南方科技大学