【paper笔记】综述阅读-A Survey of Vision-based Human Action Evaluation Methods

文章翻译:文档:A Survey of Vision-based Human Actio…
链接:文档翻译

一、文章主要内容

1、基于骨架数据的运动检测/预处理
2、handcrafted(手动设计)的特征提取方法
3、基础的数据集和现有的研究工作

二、3种human action分析的对比

三种分析包括行为识别(HAR-Human Action Recognization)、行为预测HAP-Human Action Prediction)、行为评估HAE-Human Action Evaluation)。

(一)这三者都是什么?
  • 行为识别
    (1)给静止图像或者视频分类(监督学习,有label)
    (2)找到动作开始帧结束帧
  • 行为预测
    预测未知的人类行为→发现异常→区分异常/正常
  • 行为评估
    自动对动作进行评估(打分),提出反馈或者解决方案
(二)三者的影响因素?
  • 行为识别和行为预测
    主要受人体行为本身环境背景影响
  • 行为评估
    只受**交互对象(也就是人体行为)**的影响

三、HAE概述

处于HAE主导地位的就是skeleton data-based action quality assessment(基于骨架数据的行动质量评估 )。

3.1 骨架数据的检测和预处理
3.1.1 骨架数据检测

Deep Pose是几个人体姿态估计方法的基础,比如Open Pose, Alpha Pose, Dense Pose…

3.1.2 骨架数据预处理
  1. 噪声滤波
    目的:获得健全的相似性量化细粒度质量评价
    做法:噪声滤波过程通常在大多数研究工作中的原始关节坐标上执行。传统的图像滤波技术,如拉普拉斯平滑,高斯滤波,离散余弦变换(DCT)和离散傅立叶变换(DFT),已被用于变换关节轨迹的离散坐标。因此,可以滤除零值或急剧变化的坐标,并且保留低频分量作为对人体位置的可靠检测。

  2. 归一化 / 标准化(nomalization)
    目的:由于人的身高和拍摄距离都大不相同,因此不同视频中的人体尺度可能相当不同。需要将原始骨架位置标准化为原型范围以进行比较。
    做法:首先,选择序列的第一个骨架中的左右臀部中间作为参考点。然后计算从颈部到该参考点的距离并将其定义为标准化长度。最后,通过用标准化长度缩放来变换关节的位置坐标。
    应该是这样:
    标准化长度的定义

  3. 对齐处理(alignment)
    目的:在执行动作时,表演者可能不在相对于相机的相同位置,并且动作视频通常是未修剪的,以便包括动作实例的准备和结束位置。因此,骨架位置需要在空间和时间维度上对齐。
    做法:由于距相机中心的偏移将不相同,因此通过减去髋部中心的位置来计算相对关节位置以获得骨架中心坐标表示。实际上,可以获得每个关节相对于髋关节中心关节的位置以消除空间过渡。之后,对相对关节的位置进行旋转变换。旋转角度theta由矢量从左髋到右髋到x轴的投影确定。然后通过旋转theta角的度数来变换每个关节的坐标,消除视图变化的影响。对于时间对准,传统的动态时间规整方法已经被一些前人的研究工作所采用。

3.2 手动设计(hand-crafted)特征法

这部分主要描述一下手动设计这个方法在不同领域的应用。
传统的特征检测方法

  • Spatial-Temporal(也有写成space-time的) Interest Points (STIP) —— 时空兴趣点
  • Histogram of Gradient (HOG) —— 梯度直方图
  • Histogram of Optical Flow (HOF) —— 光流直方图
  • Scale-invariant feature transform (SIFT) —— 尺度不变特征变换
  • Motion Boundary Histogram (MBH) —— 运动边界直方图

一些研究工作将行动质量评价纳入优化框架。其中,使用**bag-of-words(bow)hidden-markov模型(hmm)**训练动作模型,并给出相应的评价函数来评价动作特征的质量分数。进一步提供可解释的反馈以改善运动性能。

3.2.1 手动设计方法在物理康复方面的运用

  • Chen等人早期曾尝试在康复临床环境中开发用于定量评估人体运动质量的计算模型
    将运动学属性标准化并分类 → 改进RankSVM算法 → 评估中风幸存者的伸展和抓握能力
  • Venkataraman等人开发了一种形状理论(shape-theoretic)方法来评估单标记家庭卒中康复的运动质量
    将一维时间序列映射到重构的相空间,提取形状分布来表示映射的m维吸引子的动态形状特征。然后,训练超向量回归函数,根据动态形状特征计算质量分数。
  • Celiktutan等人提出基于图形的体育锻炼动作评价方法
    利用链式图形结构对骨骼关节间的时空关系进行建模,然后计算关节相对于躯干基部的倾角和方位角,以及关节之间的欧几里德距离,以表示姿势特征。姿态序列由链式图形结构建模,并通过图形匹配技术进行对齐。

在最近的基于骨骼的身体康复研究中,可以通过骨骼序列之间的时间比对来评估身体运动质量。

  • 安图内斯等人的研究——提出一个指导用户如何正确地执行某些动作和动作的反馈系统
    首先,对骨架数据进行预处理,使骨架实例与模板实例在空间和时间上对齐。
    然后,在计算人体各部位三维坐标欧氏距离的基础上,量化两个骨架序列之间的匹配误差,对质量评分进行评估。
    最后,通过最小化骨架匹配误差自动计算反馈方案。
  • Paiement等人研究和比较不同姿态表示和HMM模型与运动动力学的性能,以便对人体运动进行在线质量评估
    他们发展了鲁棒流形(robust manifold )表示和一阶马尔可夫假设(关于马尔科夫假设)来描述人体姿态的动态。

3.2.1 手动设计方法在体育计分方面的运用

Abstract: Gas metal arc welding (GMAW) is a widely used welding process in various industries. One of the significant challenges in GMAW is to achieve optimal welding parameters and minimize defects such as spatter and porosity. In this paper, we propose a deep-learning-based approach to analyze metal-transfer images in GMAW processes. Our approach can automatically detect and classify the different types of metal-transfer modes and provide insights for process optimization. Introduction: Gas metal arc welding (GMAW) is a welding process that uses a consumable electrode and an external shielding gas to protect the weld pool from atmospheric contamination. During the GMAW process, the metal transfer mode affects the weld quality and productivity. Three types of metal transfer modes are commonly observed in GMAW: short-circuiting transfer (SCT), globular transfer (GT), and spray transfer (ST). The selection of the transfer mode depends on the welding parameters, such as the welding current, voltage, and wire feed speed. The metal transfer mode can be observed using high-speed imaging techniques, which capture the dynamic behavior of the molten metal during welding. The interpretation of these images requires expertise and is time-consuming. To address these issues, we propose a deep-learning-based approach to analyze metal-transfer images in GMAW processes. Methodology: We collected a dataset of metal-transfer images using a high-speed camera during the GMAW process. The images were captured at a rate of 5000 frames per second, and the dataset includes 1000 images for each transfer mode. We split the dataset into training, validation, and testing sets, with a ratio of 70:15:15. We trained a convolutional neural network (CNN) to classify the metal-transfer mode from the images. We used the ResNet50 architecture with transfer learning, which is a widely used and effective approach for image classification tasks. The model was trained using the categorical cross-entropy loss function and the Adam optimizer. Results: We achieved an accuracy of 96.7% on the testing set using our deep-learning-based approach. Our approach can accurately detect and classify the different types of metal-transfer modes in GMAW processes. Furthermore, we used the Grad-CAM technique to visualize the important regions of the images that contributed to the classification decision. Conclusion: In this paper, we proposed a deep-learning-based approach to analyze metal-transfer images in GMAW processes. Our approach can automatically detect and classify the different types of metal-transfer modes with high accuracy. The proposed approach can provide insights for process optimization and reduce the need for human expertise in interpreting high-speed images. Future work includes investigating the use of our approach in real-time monitoring of the GMAW process and exploring the application of our approach in other welding processes.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值