GAP:Skeleton-based Action Recognition

论文链接:https://arxiv.org/abs/2208.05318
代码链接:https://github.com/MartinXM/GAP
论文出处:ICCV 2023
论文单位:香港理工大学

摘要

  • 基于骨骼的动作识别最近受到了相当大的关注。当前基于骨架的动作识别方法通常被表述为一个热门的分类任务,并且没有充分利用动作之间的语义关系。
  • 例如,“做胜利手势”和“竖起大拇指”是手势的两种动作,它们的主要区别在于手的动作。这些信息与动作类的分类编码无关,但可以从动作描述中揭示出来。
  • 因此,在训练中使用动作描述可能有利于表征学习。
  • 在这项工作中,我们提出了一种基于骨架的动作识别的生成动作描述提示(Generative Action-description Prompts,GAP)方法。
  • 具体而言,我们采用预训练的大规模语言模型作为知识引擎,自动生成动作肢体运动的文本描述,并提出了一种多模态训练方案,利用文本编码器生成不同肢体运动的特征向量,并监督骨架编码器进行动作表征学习。
  • 实验表明,我们提出的GAP方法在不增加推理计算成本的情况下,在各种基线模型上取得了显著的改进。
  • GAP在流行的基于骨架的动作识别基准上实现了最新的技术水平,包括NTU RGB+D, NTU RGB+D 120NW-UCLA

1.简介

  • 动作识别因其在人机交互、体育健康分析、娱乐等领域的广泛应用而成为一个活跃的研究课题。
  • 近年来,随着Kinect、RealSense等深度传感器的出现,人体关节可以很容易地获取。
  • 动作识别使用body关节等,基于骨架的动作识别由于其计算效率和对光照条件、视点变化和背景噪声的鲁棒性而受到广泛关注。
  • 以往的基于骨骼的动作识别方法大多侧重于对人体关节之间的关系进行建模,采用以一系列骨骼坐标作为输入的单模态训练方案。
  • 受最近图像和语言多模态训练成功的启发,我们研究了一个有趣的问题: 动作语言描述是否可以揭示动作关系并有利于基于骨架的动作识别?
  • 遗憾的是,由于缺乏由骨架文本对组成的大规模数据集,构建这样的数据集将需要大量的时间和财政资源。因此,该训练方案不能直接应用于基于骨架的动作识别。
  • 20
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值