声明:此文章是作者自己学习过程中的简单总结,也是作者第一次上传,仅供各位同行参考,也请对文中错误和不足多多指教,敬请指正,谢谢!
一、任务描述
给定一幅图或者是一段视频,人体姿态估计就是恢复出其中的人体关节点位置的过程。
二、挑战和难点
1.人体肢体运动较为灵活;
2. 视角的变化;
3.附着物的变化(比如遮挡,衣物等);
4.3D pose estimation缺乏数据集;
三、评价指标
主要分为以下两种:
1. PCK
PCK的评价指标多出现在单人的姿态估计上;
定义: Percentage of Correct Keypoints (PCK),reports the percentage of keypoint detection falling within a normalized distance of the ground truth.
2. mAP
主要用于多人姿态估计评价;
在物体检测中,我们是用IoU(intersection over union)来评价预测与真实标注之间的差异;在人体骨骼关键点的检测任务中,使用OKS(object keypoint similarity)代替IoU,对预测的人体骨骼关键点位置与真实标注之间的相似性进行评分;
3.OKS
四、数据集
对于以下数据集,1-4应用较多,其余应用较少:
1. Human3.6M (2D+3D)
http://vision.imar.ro/human3.6m/description.php
2. MPI-INF-3DHP (3D)
http://human-pose.mpi-inf.mpg.de/
3. SURREAL (3D)
https://www.di.ens.fr/willow/research/surreal/
4. Unite the People dataset(UP) (2D + 3D)