人体姿态估计与MMPose学习笔记

最新推荐文章于 2024-11-13 17:24:18 发布

cjyysq

最新推荐文章于 2024-11-13 17:24:18 发布

阅读量223

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cjywzj123/article/details/130997069

版权

文章详细介绍了人体姿态估计，包括2D和3D姿态估计的概念，以及从图像中恢复人体模型的方法。2D姿态估计常用热力图模型以提高精度，而多人姿态估计则涉及自顶向下和自底向上两种方法，如DeepPose和Hourglass网络。此外，还探讨了回归与热力图方法的优劣以及RLE和标准化流在建模关键点位置概率分布中的应用。

摘要由CSDN通过智能技术生成

1.什么是人体姿态估计？

答：从给定的图像中识别人脸、手部、身体的关键点。

2. 3D姿态估计？

答：就是预测人体关键点在三维空间中的坐标，在三维空间中还原人体的姿态。

进一步我们可以从图像或者视频中恢复出运动的3D人体模型

3 姿态估计后的下游任务有什么？

答：行为识别、CG动画、人机交互、动物行为分析。

2D人体姿态估计：在图像上定位人体关键点（通常为主要关节）的坐标

思路1：将关键点检测问题建模成一个回归问题，让模型直接回归关键点的坐标，即 $(x_{1},y_{1},...,x_{J},y_{J}) = f_{\Theta }(I)$

但使用深度模型直接回归坐标有困难，精度不是最优。

思路2：基于热力图（Heatmap Based），并不直接回归关键点的坐标，而是预测关键点位于每个位置的概率，即 $H_{1..j} = f_{\Theta }(I)$ ， $H_{j}(x_{j},y_{j}) = 1$ 表示关键点 j 位于 $(x_{j},y_{j})$ 的概率为1， H 称为热力图，尺寸与原图 I 相同或按比例缩小

热力图可以基于原始关键点坐标生成，作为训练训练网络的监督信息

网络愚蠢的热力图也可以通过求极大值等方法得到关键点的坐标

模型预测热力图比直接回归坐标相对容易，模型精度相对更高，因此主力算法更多基于热力图，但预测热力图的计算消耗大于直接回归

从数据标注生成热力图：

（这样热力图相当于一个高斯概率图）

问题：如何从第 j 各关键点的热力图 H 中还原关键点位置？

朴素方法：求热力图最大值位置

Integral Human Pose Regression：归一化热力图形成点位于不同为主的概率，再计算位置的期望，优点：可微分，连续没有量化误差

多人姿态估计：自顶向下方法

DeepPose：以分类网络为基础，将最后一层分类改为回归，一次性预测所有关键点的坐标，通过最小化平方误差训练网络。可以通过级联提升精度

优势：1.回归模型理论上可以达到无限精度

2.不需要维持高分辨率特征图，计算层面更高效

劣势：1. 图像到关键点坐标的映射高度非线性，导致回归坐标比回归热力图更难，回归方法的精度也弱于热力图方法。因此DeepPose提出之后很长一段时间内，2D关键点检测预测方法主要基于热力图

RLE：对关键点的位置进行更准确的概率建模，从而提高位置预测的精度。

基于二范数误差的回归和基于高斯似然的最大估计是等价的。

因而，二范数回归隐含了关键点位置符合固定方差的各向同性的高斯分布的假设

RLE的思路即是将简单的高斯分布替换为一个可学习的、表达能力更强的分布，更好拟合关键点位置的实际分布。

完成RLE模型：

标准化流 Normalizing Flow：一种生成建模方法，通过一系列可学习的可逆的映射，将标准分布的随机变量映射成复杂分布的随机变量，可用于建模复杂的概率分布

图中 f 可由神经网络构建，从而可以通过调整网络参数拟合不同的概率密度函数。

给定一系列数据，通过最大似然计算最优模型参数，使模型最佳拟合这组数据

自底向上：

Hourglass：

设计思路：准确的姿态估计需要结合不同尺度的信息：

Simple Baseline：力求结构简单，使用ResNet配合反卷积形成编码器-解码器结构

HRNet：在下采样时通过保留原分辨率分支来支持网络全过程特征图的高分辨与空间位置信息，并设计了独特的网络结构实现不同分辨率的多尺度特征融合（感觉和ResNet是一个思路）

关键点与肢体的预测：肢体方法的真值可根据关键点标注生成

肢体定义的关键点亲和度：

基于亲和度匹配关键点：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

cjyysq CSDN认证博客专家 CSDN认证企业博客

码龄5年

10: 原创

65万+: 周排名

219万+: 总排名

3235: 访问

: 等级

104: 积分

1: 粉丝

1: 获赞

3: 评论

10: 收藏

私信

关注

热门文章

最新评论

MMPretrain代码课笔记（配置文件）
爱你呦255: 为什么我运行之后找不到训练脚本呢
MMDetection和MMPose安装、训练、目标检测关键点检测
cccyd1: 如果不想使用demo/topdown_demo_with_mmdet.py文件和他的模型进行目标检测，换成yolo可以吗，是不是要对demo/topdown_demo_with_mmdet.py文件进行改动，或者使用其他配置文件
MMDetection和MMPose安装、训练、目标检测关键点检测
cccyd1: 博主你好我使用的mmpose版本信息如下 mmcv-2.0.0rc4；mmdet-3.0.0；mmpose-1.0.0。我想问一下获取目标检测框的信息是在那个文件里设置的，还有针对预测得到的关键点这里将他们打包到一起的操作，源文件里有吗，还是博主自己写的，我现在想要将关键点预测的操作修改为只在目标识别框内进行，这样每个对象的关键点连接的时候就不会连接到其他对象身上的点了，但是现在找不到关于目标检测框和预测关键点部分设置的文件。
OpenMMLab理论笔记
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/615669558。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。