人体姿态估计数据集整理（Pose Estimation/Keypoint）：MSCOCO（逐年）、LSP、FLIC、MPII、AI Challenge及打分标准

最新推荐文章于 2025-03-07 06:21:19 发布

业精于勤荒于嬉-行成于思而毁于随

最新推荐文章于 2025-03-07 06:21:19 发布

阅读量1.7w

点赞数 8

分类专栏：姿态估计逐步

本文链接：https://blog.csdn.net/m0_37644085/article/details/88898860

版权

本文整理了多个人体姿态估计数据集，包括LSP（2K样本，14个关节点）、FLIC（2W样本，9个关节点）、MPII（25K样本，16个关节点）、MSCOCO（超过30W样本，18个关节点）和AI Challenge（21W训练样本，3W验证样本，3W测试样本）。此外，介绍了评价指标如PCP、PDJ和COCO的MAP，以及各数据集的特点和应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

姿态估计等数据集收集整理；

LSP:
    样本数：2K
    关节点个数：14
    全身，单人

Leeds Sports Dataset [12]及其扩展[13]，我们将通过LSP共同表示。它们包含11000个训练和1000个测试图像。这些是来自体育活动的图像，因此在外观和特别是关节方面非常具有挑战性。

FLIC
    样本数：2W.
    关节点个数：9
    全身，单人，FLIC由从电影中拍摄的5003张图像（3987次训练，1016次测试）组成。 图像在上半身注释，大多数图形直接面向相机。

MPII
    样本数：25K
    关节点个数：16
    全身，单人/多人，40K people，410 human activities

MPII Human Pose由大约25k个图像组成，为多人提供注释，提供40k注释样本（28k训练，11k测试）。

MSCOCO
    样本数：>= 30W
    关节点个数：18
    全身，多人，keypoints on 10W people。118,287.张

AI Challenge
    样本数：21W Training, 3W Validation, 3W Testing
    关节点个数：14
    全身，多人，38W people

打分标准Metrics：

LSP、FLIC、MPII：

Percentage of Correct Parts (PCP)

Percent of DetectedJoints (PDJ).（pcp改进版本）

COCO:

MAP

mask rcnn 是把2014组合了，也就是coco 2017，包括对应的annotations具体为：

train2014：person_keypoints_train2014.json （80k）

val2014： ①person_keypoints_val2014.json

②person_keypoints_minival2014.json （5k ，常用验证集）

③ person_keypoints_valminusminival2014.json （35k）

train 2017=person_keypoints_train2014.json +person_keypoints_valminusminival2014.json

也就是训练集有 115k张图片。准确数字为118,287.张

1 gpu下，2img/gpu；一个epoch 为57500iters。作者是12.17个epoch，也就是约为 72万。

"keypoints_coco_2014_train": {