AQA&HPE 论文整理

文章概述了动作质量评估(AQA)的研究进展,包括基于I3D模型的基础骨架,直接回归质量分数的方法,利用时间空间关系图评估关节运动,以及通过对比学习和分布自编码器来解决数据不确定性的技术。同时,也提及了人体姿态估计(HPE)的相关研究。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

现将动作质量评估Action Quality Assessment(AQA)方向和人体姿态估计Human Pose Estimation(HPE)方向上看过的一些论文整理在此。

动作质量评估AQA

AQA通过分析视频中动作的表现来评估动作的执行质量。与传统的动作识别不同,AQA更具有挑战性:动作识别可以从一张或几张图像中识别一个动作,AQA则需要遍历整个动作序列来评估动作的质量。现有的大多数AQA方法都是通过视频的深度特征来回归不同的动作质量得分,然而,在相似背景下评估差异很小的不同动作之间的质量是很困难的。

1. 基础backbone—I3D模型

《Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset》— CVPR 2017

提出了 inflated 3D netword(I3D)模型,将一个2D模型扩张到一个3D模型,好处是不用再设计一个专门的视频理解网络,可以使用2D中已经设计好的网络(如 VGG、ResNet 等),将它们直接扩张到3D,甚至还可以用一些巧妙的方式将它们的预训练模型也利用起来,不仅设计上比较简单,还能省掉很多预训练的麻烦。I3D可以用于提取视频里的动作特征。

2. 直接回归质量分数

Assessing the Quality of Actions

《Assessing the Quality of Actions》— ECCV 2014

3. 时间空间关系图评估关节运动

Action Assessment by Joint Relation Graphs

《Action Assessment by Joint Relation Graphs》— ICCV 2019

4. 对比回归学习视频间的相对分数

Group-aware Contrastive Regression for Action Quality Assessment

《Group-aware Contrastive Regression for Action Quality Assessment》— ICCV 2021

5. 分布自编码器—将特征编码成分布来解决数据不确定性

Auto-Encoding Score Distribution Regression for Action Quality Assessment

《Auto-Encoding Score Distribution Regression for Action Quality Assessment》— CVPR 2021

人体姿态估计HPE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值