三维人体姿态估计年度进展综述(周晓巍教授)


人体姿态估计:是指还原给定图片或视频中人体关键点位置的过程。一般来说,会先检测、定位画面中的人体,再对人体进行关键点分析。通常人们会选择18个关键点,对应着人体最主要的关节和部位。
如果人的一部分被遮挡或者画面中有太多的人,甚至在运动中互相进行了遮挡,机器还能识别吗?引入人体结构化信息是个不错的选择,人类的骨骼有一定的限度,如果关键点之间的距离过远,就要考虑是否有另一个人或是识别错误。
如果输入的是视频数据,我们还可以利用相邻帧间人体姿态的连续性改进姿态识别结果。
可以应用在安防领域判断画面中的人是否有过激行为,及时报警;应用在新零售判断人们的购买等行为;应用于步态分析评估运动员的运动状况、提升成绩或是干脆作为生物识别标识,定位追踪空间中的个人;动作捕捉,如跳舞类的游戏或者作为人机交互手段,隔空控制家电设备。

一. 定义

输入一张RGB图像,希望恢复图像中人的三维姿态。

二. 目前常用的三维姿态的表示方式(两种)

1.三维关键点,连成三维骨架,进行可视化,估计关键点在空间中的位置;
2.参数化的人体几何模型,常用的SMPL模型,通常由一组姿态控制它的形变,需要估计姿态的参数,估计外形的参数。
在这里插入图片描述

三. 基本解法

  1. Optimization 优化 通过变化三维人体时的参数,使模型在图像平面里的投影跟图像的特征对齐,比如二维的关键点的轮廓。局限:需要一个比较好的初始化,优化的过程也比较慢,比较容易陷入局部最优。
  2. Regression using a neural net
    基于深度学习,从输入的图像回归姿态的参数,比较快,利用端到端的学习。
    在这里插入图片描述
    以上两种解法也可以结合在一起,利用网络预测出一个比较好的初始化,进一步利用图像的特征对姿态进行优化。

四. 研究倾向

在这里插入图片描述

4.1 Weak supervision(弱监督学习)

很难标注图像中的3D姿态。
在这里插入图片描述
1.利用2D的信息做监督,model fitting in the loop
在这里插入图片描述
2.利用unpaired data
在这里插入图片描述

3.利用多视图
在这里插入图片描述

4.2 From image to video(视频中的姿态估计)

1.特征提取的时候考虑帧的信息,用lstm
2.将3D姿态的判别器扩展到3D运动的判别器
在这里插入图片描述

4.3 Total capture of detailed motion(对全身的精细的运动捕捉)

在这里插入图片描述
在这里插入图片描述

4.4 Multiple people(多人的3D姿态估计)

在这里插入图片描述
解决该问题的思路:
1.Top-down framework:先在图像检测人,针对每一个人去估计根点的位置,以及相对于根节点的3D的pose。单人姿态估计上加了对于每个人的位置估计。
在这里插入图片描述2. Bottom-up framework
先用网络去回归出一些中间的表示,2D 的关键点,以及根节点的深度图,再组合多人的3D骨架。
在这里插入图片描述

4.5 Human-scene interaction(人体与场景的交互)

在这里插入图片描述
2.利用场景的信息推测人体的姿态,减少三维姿态估计中的歧义。
在这里插入图片描述
3.运动捕捉+运动仿真
在这里插入图片描述
Paper list:
https://github.com/zju3dv/Monocular_3D_human

  • 2
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RGBD 三维人体姿态估计是指利用RGB和深度图像数据进行人体姿态估计的技术。RGBD 人体三维重建数据集通常包含多组RGB和深度图像,每组图像对应不同的视角或姿态。这些数据集被用于训练和评估人体三维姿态估计算法,以在计算机视觉应用中使用。人体姿态估计可以作为其他算法的辅助环节,如动画、游戏运动捕捉系统和行为理解。在人体姿态估计中,可以使用深度学习模型建立单目RGB图像到3D坐标的映射,也可以先获取2D信息,然后再将其提升到3D姿态。不同的方法和网络架构可以用于实现RGBD 三维人体姿态估计,如Hourglass、CPN等。此外,还可以使用预训练好的2D姿态网络来辅助3D姿态估计。总的来说,RGBD 三维人体姿态估计需要复杂的网络架构和充足的训练样本,同时还需要考虑背景、光照和人的穿着等因素的影响。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [RGBD人体三维重建数据集](https://blog.csdn.net/weixin_35750747/article/details/129567009)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [3D人体姿态估计总结](https://blog.csdn.net/weixin_43125047/article/details/108690088)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [2D/3D人体姿态估计 (2D/3D Human Pose Estimation)](https://blog.csdn.net/MyArrow/article/details/104581761)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值