人体姿态估计-Human Pose Estimation (2021)

1. 基于RGB的人体姿态估计

1.1 关键的姿态识别方法总结

  • PCKh:Head-normalized Percentage of Correct Keypoints
  • 高通845 SoC:
    • 4 Cortex A55 cores and 4 Cortex A75 cores
    • 1 Adreno 630 GPU
模型CPUGPUPCKh@0.5硬件平台特点
2-stage Hourglass1,640ms-90.9高通845 SoC CPU
SimpleBaseline-509,520ms-91.5高通845 SoC CPU
HRNet-W326,810ms-92.3高通845 SoC CPU高准确率
PoseNet60ms27ms80.2高通845 SoC CPU高度修剪的CNN模型
MobiPose47ms34ms85.8高通845 SoC CPUBoundingBox跟踪+反向残差

1.2 Top-Down步骤

  • 第一步:检测人以生成Bounding Box
  • 第二步:识别每一个人的Pose

1.3 MobiPose

  • MobiPose系统架构
    在这里插入图片描述

1.3.1 检测人

  • 关键帧:通过SSDLite + MobileNetv3-S (18.6ms on高通845 SoC)
  • 跟踪帧:根据Video Codec的运动向量(MV: Motion Vector),使用卡尔曼滤波方法预测人的Bounding Box.

1.3.2 位姿估计

  • 模型:基于Hourglass模型
  • 层模块:反向残差(inverted residual)+ SE(squeeze and excitation)+ H-Swish
    • 反向参差: 对于移动视觉识别,它是一个非常有效的特征提取器
    • SE:它是SEnet 中提出的一种轻量级的注意力模块,与反向残差块结合使用以提高其特征提取能力
    • H-Swish:此激活函数可以提高模型的准确率
  • 多尺度:定位不同的关节需要不现的尺度
    在这里插入图片描述
  • 模型结构
    在这里插入图片描述

1.3.3 异构计算(CPU+GPU)

  • CPU与GPU并行工作

2. 基于深度图像的姿态估计

2.1 Residual Pose

  • 主要思路:充分利用深度信息,并将任务分解为:
    • 2D多人姿态估计
    • 3D姿态回归:
      • 使用深度信息和先验姿态(以处理部分遮挡)
      • 创新的有效残差姿态3D回归方法
  • 主要框架如下:
    在这里插入图片描述

2.2 Microsoft算法

2.2.1 算法1-身体部位分类 (Body Part Classification)

  • 第一步:每个像素分类(Per Pixel Classification)
    在这里插入图片描述

  • 第二步:身体候选关节的聚合(Aggregation of Body Joint Proposals)
    在这里插入图片描述

2.2.2 算法2-偏移量关节回归(Offset Joint Regression)

  • 直接为身体候选关节投票,无需身体部位
    在这里插入图片描述

2.2.3 算法1和算法2的结果相似

在这里插入图片描述

  • 4
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值