姿态估计等数据集收集整理;
LSP:
样本数:2K
关节点个数:14
全身,单人
Leeds Sports Dataset [12]及其扩展[13],我们将通过LSP共同表示。它们包含11000个训练和1000个测试图像。这些是来自体育活动的图像,因此在外观和特别是关节方面非常具有挑战性。
FLIC
样本数:2W.
关节点个数:9
全身,单人,FLIC由从电影中拍摄的5003张图像(3987次训练,1016次测试)组成。 图像在上半身注释,大多数图形直接面向相机。
MPII
样本数:25K
关节点个数:16
全身,单人/多人,40K people,410 human activities
MPII Human Pose由大约25k个图像组成,为多人提供注释,提供40k注释样本(28k训练,11k测试)。
MSCOCO
样本数:>= 30W
关节点个数:18
全身,多人,keypoints on 10W people。118,287.张
AI Challenge
样本数:21W Training, 3W Validation, 3W Testing
关节点个数:14
全身,多人,38W people
打分标准Metrics:
- LSP、FLIC、MPII:
Percentage of Correct Parts (PCP)
Percent of DetectedJoints (PDJ).(pcp改进版本)
- COCO:
MAP
mask rcnn 是把2014组合了,也就是coco 2017,包括对应的annotations具体为:
train2014:person_keypoints_train2014.json (80k)
val2014: ①person_keypoints_val2014.json
②person_keypoints_minival2014.json (5k ,常用验证集)
③ person_keypoints_valminusminival2014.json (35k)
train 2017=person_keypoints_train2014.json +person_keypoints_valminusminival2014.json
也就是训练集有 115k张图片。准确数字为118,287.张
1 gpu下,2img/gpu;一个epoch 为57500iters。作者是12.17个epoch,也就是约为 72万。
"keypoints_coco_2014_train": { |