基于深度学习的3D pose estimation总结(包括几篇2D pose estimation)

本文概述了基于深度学习的3D人体姿态估计任务,探讨了挑战,如灵活的肢体运动、视角变化和数据缺乏。主要评价指标包括PCK和mAP。介绍了Human3.6M、MPI-INF-3DHP等数据集,并讨论了Convolutional Pose Machines、Stacked Hourglass Networks等现有工作。未来研究方向包括密集多人姿态估计。
摘要由CSDN通过智能技术生成

声明:此文章是作者自己学习过程中的简单总结,也是作者第一次上传,仅供各位同行参考,也请对文中错误和不足多多指教,敬请指正,谢谢!

一、任务描述

给定一幅图或者是一段视频,人体姿态估计就是恢复出其中的人体关节点位置的过程。

二、挑战和难点

1.人体肢体运动较为灵活;

2. 视角的变化;

3.附着物的变化(比如遮挡,衣物等);

4.3D pose  estimation缺乏数据集;

三、评价指标

主要分为以下两种:

1. PCK 

PCK的评价指标多出现在单人的姿态估计上;

定义: Percentage of Correct Keypoints (PCK),reports the percentage of keypoint detection falling within a normalized distance of the ground truth.

2. mAP

主要用于多人姿态估计评价;

在物体检测中,我们是用IoU(intersection over union)来评价预测与真实标注之间的差异;在人体骨骼关键点的检测任务中,使用OKS(object keypoint similarity)代替IoU,对预测的人体骨骼关键点位置与真实标注之间的相似性进行评分;

3.OKS

四、数据集

对于以下数据集,1-4应用较多,其余应用较少:

1. Human3.6M (2D+3D)

http://vision.imar.ro/human3.6m/description.php

2. MPI-INF-3DHP (3D)

http://human-pose.mpi-inf.mpg.de/

3. SURREAL (3D)

https://www.di.ens.fr/willow/research/surreal/

4. Unite the People dataset(UP)   (2D + 3D)

http://files.is.tuebingen.mpg.de/classner/up/

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值