OpenMMLab AI实战营第二期｜人体关键点检测与MMPose学习笔记

疯狂输出的加特林

已于 2023-06-02 10:17:47 修改

阅读量1.7k

点赞数

分类专栏： OpenMMLab 文章标签：人工智能学习笔记

于 2023-06-01 23:40:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29203987/article/details/130997783

版权

OpenMMLab 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

OpenMMLab AI实战营第二期｜人体关键点检测与MMPose学习笔记

在这里插入图片描述

文章目录

OpenMMLab AI实战营第二期｜人体关键点检测与MMPose学习笔记
一、前言
- 1.1 人体姿态概述
- 1.2 讲师介绍
二、课程内容

一、前言

1.1 人体姿态概述

人体姿态估计（Human Pose Estimation）是计算机视觉领域中的一个重要研究方向，也是计算机理解人类动作、行为必不可少的一步，人体姿态估计是指通过计算机算法在图像或视频中定位人体关键点，目前被广泛应用于动作检测、虚拟现实、人机交互、视频监控等诸多领域。

1.2 讲师介绍

卢策吾 老师
上海交通大学电院计算机系教授、博士生导师；
主要从事具身智能，计算机视觉的研究。开源了一系列如 AlphaPose、HAKE、GraspNet 等多项拥有国际先进水平的开源人工智能框架和数据集，多项成果在智能安防、机器人、无人车等重要领域得到应用。

本次课程涵盖人体姿态估计的介绍与应用、2D 姿态估计、3D 姿态估计、DensePose、Body Mesh 以及 MMPose 等内容。

二、课程内容

2.1 人体姿态估计的介绍与应用

2.1.1 什么是人体姿态估计

在这里插入图片描述

2.1.2 3D姿态估计

在这里插入图片描述

2.1.3 人体参数化模型

在这里插入图片描述

2.1.4 下游任务

2.1.4.1 行为识别

在这里插入图片描述

2.1.4.2 CG、动画

在这里插入图片描述

2.1.4.3 动物行为分析

在这里插入图片描述

2.2 2D姿态估计

2.2.0 任务描述

在这里插入图片描述

2.2.0.1 基于回归(Regression Based)

在这里插入图片描述

2.2.0.1.1 DeepPose(2014)

在这里插入图片描述

2.2.0.1.1.1 通过级联提升精度

在这里插入图片描述

2.2.0.1.2 回归方法的优势与劣势

在这里插入图片描述

2.2.0.1.3 Residual Log-likelihood Estimation(RLE)(2021)

在这里插入图片描述

2.2.0.1.3.1 背景知识：回归和最大似然估计的联系

在这里插入图片描述

2.2.0.1.3.2 背景知识：标准化流Normalizing Flow

在这里插入图片描述

2.2.0.1.3.3 RLE的整体设计

在这里插入图片描述

2.2.0.1.3.4 重参数化设计

在这里插入图片描述

2.2.0.1.3.5 残差似然函数

在这里插入图片描述

2.2.0.1.3.6 完整的RLE模型

在这里插入图片描述

2.2.0.2 基于热力图(Heatmap Based)

在这里插入图片描述

2.2.0.3 从数据标注生成热力图

在这里插入图片描述

2.2.0.4 使用热力图训练模型

在这里插入图片描述

2.2.0.5 从热力图还原关键点

在这里插入图片描述

2.2.1 多人姿态估计：自顶而下方法

在这里插入图片描述

2.2.2 Hourglass(2016)

在这里插入图片描述

2.2.2.1 级联Hourglass模块

在这里插入图片描述

2.2.1.2 不同的级联和监督方式

在这里插入图片描述

2.2.1.3 Hourglass模块

在这里插入图片描述

2.2.2 HRNet(2020)

在这里插入图片描述

2.2.2.1 HRNet的特征融合方式

在这里插入图片描述

2.2.2.2 HRNet配合不同任务头

在这里插入图片描述

2.2.2 多人姿态估计：自底而上方法

在这里插入图片描述

2.2.3 PartAffinity Field & OpenPose(2016)

在这里插入图片描述

2.2.3.1 关键点与肢体的预测

在这里插入图片描述

2.2.3.2 关键点与关节的预测

在这里插入图片描述

2.2.3.3 肢体定义的关键点亲和度

在这里插入图片描述

2.2.3.4 基于亲和度匹配关键点

在这里插入图片描述

2.2.4 单阶段方法

2.2.4.1 SPM(2019)

在这里插入图片描述

2.2.4.2 SPR

在这里插入图片描述

2.2.4.3 Hierarchical SPR

在这里插入图片描述

2.2.4.3.1 网络设计

在这里插入图片描述

2.2.4.3.2 回归策略

在这里插入图片描述

2.2.4.3.3 损失函数

在这里插入图片描述

2.2.5 基于Transformer的方法

2.2.5.1 PRTR2021

在这里插入图片描述

2.2.5.1.1 PRTR两阶段算法

在这里插入图片描述

2.2.5.1.2 PRTR单阶段算法

在这里插入图片描述

2.2.6.2 TokenPose

在这里插入图片描述

小结
在这里插入图片描述

2.3 3D姿态估计

2.3.1 任务描述

在这里插入图片描述

2.3.2 背景知识：绝对坐标 vs 相对坐标

在这里插入图片描述

2.3.3 思路1：直接预测

在这里插入图片描述

2.3.3.1 Coarse-to-Fine Volumetric Prediction 2017

在这里插入图片描述

2.3.3.2 Simple Baseline 3D 2017

在这里插入图片描述

2.3.4 思路2：利用视频信息

在这里插入图片描述

2.3.4.1 VideoPose3D 2018

在这里插入图片描述

思路3：利用多角度图像

2.3.5.1 VoxelPose 2020

在这里插入图片描述

2.4 人体姿态估计的评估方法

2.4.1 Percentage of Correct Parts(PCP)

在这里插入图片描述

2.4.2 Percentage of Detected Joints(PDJ)

在这里插入图片描述

2.4.3 Percentage of Correct Key-points(PCK)

在这里插入图片描述

2.4.4 Object Keypoints Similarity(OKS) based mAP

在这里插入图片描述

2.5 DensePose

2.5.1 DensePose(2014)

2.6 人体参数化模型

2.6.1 背景知识：人体表面参数化

在这里插入图片描述

2.6.1.1 标注方法

在这里插入图片描述

2.6.2 网络结构

在这里插入图片描述

2.6.2.1改进设计

在这里插入图片描述

2.6.3 身体表面网络(Body Mesh)

在这里插入图片描述

2.6.4 混合蒙皮技术(Blend SKinning)

在这里插入图片描述

2.6.5 线性混合蒙皮LBS(Linear Blend Skinning)

在这里插入图片描述

2.6.6 SMPL人体参数化模型

在这里插入图片描述

2.6.6.1 形态参数 $\beta$ 与姿态参数 $\theta$

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2.6.6.2 SMPL模型的应用

在这里插入图片描述

2.6.7 SMPLify算法流程

在这里插入图片描述

2.6.7.1关键点投影损失

在这里插入图片描述

2.6.7.2 人体姿态约束

在这里插入图片描述

在这里插入图片描述

2.6.7.3 “胶囊“近似人体

在这里插入图片描述

2.6.7.4 人体形态约束

在这里插入图片描述

2.6.7.5 损失函数

在这里插入图片描述

2.6.8 HMR

在这里插入图片描述

2.6.8.1 算法设计

在这里插入图片描述

2.6.8.2 回归模型设计

在这里插入图片描述

2.6.8.3 2D投影损失

在这里插入图片描述

2.6.8.4 引入判别器

在这里插入图片描述

疯狂输出的加特林

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

疯狂输出的加特林 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。