Assessing the Quality of Actions 论文笔记

最新推荐文章于 2025-04-30 20:09:44 发布

sulizhi_ylearn

最新推荐文章于 2025-04-30 20:09:44 发布

阅读量646

点赞数

分类专栏：论文阅读文章标签：论文阅读人工智能

本文链接：https://blog.csdn.net/qq_44502497/article/details/128618142

版权

论文阅读专栏收录该内容

4 篇文章

订阅专栏

该研究提出了一个通用框架，利用时空姿势特征来评估人体动作质量，为医疗、体育和视频检索等领域提供自动化评估。通过姿势特征提取、回归模型预测动作得分，并给出可解释的反馈建议，帮助表演者改进动作。此外，还发布了新的数据集以促进进一步研究。研究结果显示，基于姿势的特征在动作质量评估中表现出色，并能生成有助于视频总结的亮点片段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、研究动机

评估动作质量的方法在医疗（患者在住院后执行日常任务时，通常会受到监控和评估，如果没有自动评估方法，这是一项昂贵的任务）、体育（允许运动员在摄像机前练习，并实时接收质量分数，为运动员提供快速反馈和改进动作的机会）和视频检索（视频搜索引擎可能希望根据所执行操作的质量而不是相关性对结果进行排序）中有许多实际应用，但在计算机视觉中还尚未探索。

二、所做工作及贡献

①引入了一个通用的基于学习的框架，用于使用时空姿势特征评估人体动作的质量；

②系统向表演者提供可解释的反馈，说明如何提高他们的动作质量；通过找出哪些片段对动作质量贡献最大来创建视频的亮点

③发布了一个新的动作质量评估数据集，以期促进这项任务的未来研究。

三、创新点

首个提出学习评估视频中基于人体的动作质量的一般框架，通过提取人的时空姿势特征，并用最少的注释，估计预测动作得分的回归模型来工作。

四、研究思路

从视频中提取姿势特征，通过姿势特征到质量分数的回归来学习动作质量评估模型

1.姿势特征的提取：

$p^{(j)}(t)$ : 视频第t帧中第j个关节的x分量， $p^{(0)}(t)$ ：视频第t帧中头部位置的x分量

相对于头部位置的关节位置：
$q^{(j)}(t)=p^{(j)}(t)-p^{(0)}(t)$
$q^{(j)}$ ：第j个关节的x分量，是时间的函数，通过离散余弦变换(DCT)在频域中表示(A是离散余弦转换矩阵)：
$Q^j=Aq^j$
使用k个最低频率分量创建特征向量
$\phi_j=|Q^j_{1:k}|$
计算x和y分量的每个关节的 $\phi_j$ ，连接起来以创建最终的特征向量 $\phi$

运行姿势估计算法查找每个帧中关节的位置，用[33]找到单帧最佳姿势，用[34]找到N个最佳姿势，用动态编程算法关联姿势，以在整个视频中找到最佳轨迹。

2.回归：

$\Phi_i∈R^{k\times n}$ 是矩阵形式的视频i的姿势特征,其中n是关节数，k是低频分量数

$y_i∈R$ 表示视频i中动作的真实质量分数，由专家人工判断得出

用线性支持向量回归 LSVR 预测训练集上给定特征 $\Phi_i$ 的 $y_i$ ，用 libsvm

进行交叉验证以估计超参数

3.反馈建议：

① 计算得分相对于每个关节位置的梯度 $\frac{\partial S}{\partial p^{(j)}(t)}$ ，S是得分函数

通过计算最大梯度找到表演者必须移动的关节和方向，以改进得分

② L-SVR学习了一个权重向量 $W∈R^{k\times n}$ ，使得W通过点积预测动作质量得分：
$S=\sum_{f=1}^k\sum_{j=1}^nW_{fj}\Phi_{fj}$
其中， $\Phi_{fj}$ 是第j个关节的第f个频率分量

③ 计算得分S相对于每个关节位置 $p^{(j)}(t)$ 的梯度：
$\frac{\partial S}{\partial p^{(j)}(t)}=\sum_{f=1}^kA_{fj}W_{fj}\cdot sign(\sum_{t'=1}^T(A_{ft'}(p^{(j)}(t')-p^{(0)}(t'))))$

通过计算最大 $max_{p^{(j)}(t)}\frac{\partial S}{\partial p^{(j)}(t)}$ ，可以找到表演者必须移动的关节和方向，以最大程度地提高分数。

4.视频重点：

测量一个视频片段对质量分数的影响，有助于总结导致高分数或低分数的行动部分。

一个片段的影响定义为，如果该片段被删除，质量分数会改变多少。
在这里插入图片描述
使用 $\hat{Q}^j$ 为缺失片段的视频创建特征向量。最后，我们通过计算原始特征向量和包含缺失片段的特征向量之间的分数差来确定缺失片段的影响。

五、研究结果

1.动作质量评估

在这里插入图片描述
跳水评估：显示了跳水数据集的平均等级相关性。越高越好。基于姿势的特征提供了最佳性能

花样滑冰评估：计算了花样滑冰数据集的平均等级相关性。越高越好

基于姿势的特征具有竞争力，甚至可以在跳水数据集上获得最佳性能

非专家注释者只能达到19%的等级相关性，这是使用姿势特征的支持向量回归的一半
在这里插入图片描述
限制与不足：①姿势估计对于运动员姿势会预估不准确，导致质量分数评估不准确（姿势估计的进步或使用深度传感器进行姿势估计可以改进）；②系统只针对一个人进行评估，无法评估多人情景；③没有建模动作中使用的对象，也未考虑物理效果，导致对某些活动的质量分数会聘雇不准确。