人体姿态估计-Human Pose Estimation (2021)

1. 基于RGB的人体姿态估计

1.1 关键的姿态识别方法总结

  • PCKh:Head-normalized Percentage of Correct Keypoints
  • 高通845 SoC:
    • 4 Cortex A55 cores and 4 Cortex A75 cores
    • 1 Adreno 630 GPU
模型CPUGPUPCKh@0.5硬件平台特点
2-stage Hourglass1,640ms-90.9高通845 SoC CPU
SimpleBaseline-509,520ms-91.5高通845 SoC CPU
HRNet-W326,810ms-92.3高通845 SoC CPU高准确率
PoseNet60ms27ms80.2高通845 SoC CPU高度修剪的CNN模型
MobiPose47ms34ms85.8高通845 SoC CPUBoundingBox跟踪+反向残差

1.2 Top-Down步骤

  • 第一步:检测人以生成Bounding Box
  • 第二步:识别每一个人的Pose

1.3 MobiPose

  • MobiPose系统架构
    在这里插入图片描述

1.3.1 检测人

  • 关键帧:通过SSDLite + MobileNetv3-S (18.6ms on高通845 SoC)
  • 跟踪帧:根据Video Codec的运动向量(MV: Motion Vector),使用卡尔曼滤波方法预测人的Bounding Box.

1.3.2 位姿估计

  • 模型:基于Hourglass模型
  • 层模块:反向残差(inverted residual)+ SE(squeeze and excitation)+ H-Swish
    • 反向参差: 对于移动视觉识别,它是一个非常有效的特征提取器
    • SE:它是SEnet 中提出的一种轻量级的注意力模块,与反向残差块结合使用以提高其特征提取能力
    • H-Swish:此激活函数可以提高模型的准确率
  • 多尺度:定位不同的关节需要不现的尺度
    在这里插入图片描述
  • 模型结构
    在这里插入图片描述

1.3.3 异构计算(CPU+GPU)

  • CPU与GPU并行工作

2. 基于深度图像的姿态估计

2.1 Residual Pose

  • 主要思路:充分利用深度信息,并将任务分解为:
    • 2D多人姿态估计
    • 3D姿态回归:
      • 使用深度信息和先验姿态(以处理部分遮挡)
      • 创新的有效残差姿态3D回归方法
  • 主要框架如下:
    在这里插入图片描述

2.2 Microsoft算法

2.2.1 算法1-身体部位分类 (Body Part Classification)

  • 第一步:每个像素分类(Per Pixel Classification)
    在这里插入图片描述

  • 第二步:身体候选关节的聚合(Aggregation of Body Joint Proposals)
    在这里插入图片描述

2.2.2 算法2-偏移量关节回归(Offset Joint Regression)

  • 直接为身体候选关节投票,无需身体部位
    在这里插入图片描述

2.2.3 算法1和算法2的结果相似

在这里插入图片描述

  • 4
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
人体姿态估计Human Pose Estimation)是计算机视觉领域的一个重要方向,其目标是从图像或视频中自动地检测并识别人体的姿态。人体姿态估计技术在很多领域都有应用,比如动作捕捉、人体行为分析、游戏开发、人机交互等。本文将介绍人体姿态估计的工程背景。 一、人体姿态估计的发展历程 早期的人体姿态估计方法主要是基于传统的机器学习算法,比如支持向量机(SVM)、随机森林(Random Forest)等。这些方法需要手工设计特征,并且很难捕捉到人体姿态中的细微变化。因此,它们的性能有限。 近年来,深度学习技术的发展为人体姿态估计带来了新的突破。通过使用深度卷积神经网络(CNN),可以自动地学习到更加丰富和抽象的特征,从而提高人体姿态估计的准确性。目前,在深度学习技术的推动下,人体姿态估计的性能已经得到了显著提升,成为计算机视觉领域的热门研究方向之一。 二、人体姿态估计的应用领域 1. 动作捕捉 动作捕捉是指将人体的运动姿态转化成数字化数据的过程。它在电影、游戏、虚拟现实等领域有广泛应用。人体姿态估计技术可以帮助动作捕捉系统更加准确地捕捉人体的运动姿态,从而提高数字化数据的质量。 2. 人体行为分析 人体行为分析是指从图像或视频中识别人体的行为,比如走路、跑步、打球等。人体姿态估计技术可以帮助人体行为分析系统更加准确地识别人体的动作,从而提高行为分析的准确性。 3. 游戏开发 在游戏开发中,人体姿态估计技术可以帮助游戏引擎更加准确地模拟人体的运动姿态,从而提高游戏的真实感和交互性。 4. 人机交互 人机交互是指人与计算机之间的交互,比如手势识别、面部表情识别等。人体姿态估计技术可以帮助计算机更加准确地识别人体的动作和姿态,从而提高人机交互的效率和便捷性。 三、人体姿态估计的挑战和未来发展 人体姿态估计技术的发展还面临着一些挑战。首先,由于人体的姿态变化非常复杂,需要更加丰富和复杂的模型来捕捉这些变化。其次,由于人体姿态估计涉及到关节点的检测和连接,需要更加精细和准确的算法来处理这些问题。最后,由于人体姿态估计需要处理的数据量非常大,需要更加高效的算法和系统来支持大规模数据的处理。 未来,人体姿态估计技术还将继续发展。一方面,随着深度学习技术的发展,人体姿态估计的准确性和鲁棒性将进一步提高。另一方面,人体姿态估计技术将会与其他技术相结合,比如手部跟踪、面部表情识别等,从而实现更加全面和精细的人机交互。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值