2D与3D人体姿态估计数据集（统计）

最新推荐文章于 2024-06-21 14:43:42 发布

fadedtj

最新推荐文章于 2024-06-21 14:43:42 发布

阅读量5k

点赞数 5

分类专栏：姿态估计 Pose Estimation 数据集文章标签：计算机视觉深度学习

本文链接：https://blog.csdn.net/m0_50811752/article/details/116356032

版权

相关数据集的快速发展促进了基于深度学习的姿态估计方法的发展。公共数据集为不同的方法提供了培训来源和公平的比较。考虑到数据集的规模和姿势和场景的多样性，在本文中，主要介绍了近年来的代表性数据集。它们中大多数都是高质量和大规模的数据集，在不同的拍摄场景中都有良好的注释。

图像级2D单人数据集

Leeds Sports Pose (LSP) Dataset

Leeds Sports Pose (LSP) Dataset(LSP)是从Flickr使用八项运动活动（田径、羽毛球、棒球、体操、跑酷、足球、网球和排球）的标签收集的。该数据集包含2000张图像，其中1000张图像用于训练，其余1000张图像用于测试。每个人都由全身的14个关键点进行标记。与那些新发布的数据集相比，LSP的规模相对较小。它是对单人姿态估计方法的初始性能评估。

S. Johnson and M. Everingham, “Clustered pose and nonlinear appearance models for human pose estimation.” in BMVC, 2010.

Frames Labeled in Cinema (FLIC) Dataset

Frames Labeled in Cinema (FLIC) Dataset包含从好莱坞电影中收集的5003张图像。他们每在30部电影的第十帧上运行一次人体探测器[L. Bourdev等人的研究]。最初，2万名候选人是由众包市场亚马逊机械土耳其有10个上半身关键点。患者被遮挡或严重非额叶的图像被滤掉。最后，选择了1016张图像作为测试集。

B. Sapp and B. Taskar, “Modec: Multimodal decomposable models for human pose estimation,” in CVPR, 2013.
L. Bourdev and J. Malik, “Poselets: Body part detectors trained using 3d human pose annotations,” in ICCV, 2009.

MPII Dataset

MPII数据集是一个大型数据集，包含丰富的活动和多样性捕获环境。它是从YouTube上跨越491个不同活动的3913个视频中收集出来的。从收集的视频中提取24,920帧。这些注释是由亚马逊机械土耳其人(AMT)上的内部工人进行的。注释包括16个关键点的二维位置，完整的三维躯干和头部方向，关键点的遮挡标签，和活动标签。相邻的视频帧也可用于运动信息。最后，标记人数为40522人，其中28821人用于培训，11701人用于检测。MPII数据集已被广泛应用于姿态估计和其他姿态相关的任务。表中的内容。四、展示了在MPII测试集上评估的最新方法。由于该姿势相对容易，所以检测到的二维关键点的精度较高而且性能也接近饱和度。

M. Andriluka, L. Pishchulin, P. Gehler, and B. Schiele, “2d human pose estimation: New benchmark and state of the art analysis,” in CVPR, 2014.

图像级2D多人数据集

Microsoft Common Objects in COntext (MSCOCO) Dataset

Microsoft Common Objects in COntext (MSCOCO)数据集包含用于对象检测、泛视分割和关键点检测的注释。这些图片收集的来自谷歌、必应和Flickr等网站。这些注释由Amazon’s Mechanical Turk (AMT)上的工作人员执行。该数据集包含超过20万张图像和25万人的实例。与数据集一起，自2016年以来，COCO关键点检测的挑战每年都在举行。该数据集有两个版本。区别在于训练和验证集的分割。在2017年的最新版本中，训练/val图像分割是118K/5K，而不是之前的83K/41K。测试集包含20K个图像，注释由官方测试服务器保存。此外，还发布了12万张未标记图像，它们遵循与标记图像相同的类分布。它们可以用于半监督的学习。对于关键点检测，17个关键点与可见性标签、边界框和身体分割区域一起被标记。COCO数据集一直是一个被广泛使用的评估基准，并作为动作识别和人的ReID等姿势相关任务的辅助数据。表V中的相关内容显示了最先进的方法在COCO测试集中的性能。RSN[Y. Cai等人的研究]实现了78.6mAP，显示了自上而下的方法的优越性。随着网络骨干网和关键分组方法的改进，自下而上的方法迅速发展。HigherHRNet [B.-W. Cheng等人的研究]获得70.5mAP。自下而上的方法可能有可能实现与自上而下的方法类似的性能。

T.-Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollár, and C.-L. Zitnick, “Microsoft coco: Common objects in context,” in ECCV, 2

最低0.47元/天解锁文章

fadedtj

关注

5
点赞
踩
38

收藏

觉得还不错? 一键收藏
1
评论
2D与3D人体姿态估计数据集（统计）

相关数据集的快速发展促进了基于深度学习的姿态估计方法的发展。公共数据集为不同的方法提供了培训来源和公平的比较。考虑到数据集的规模和姿势和场景的多样性，在本文中，主要介绍了近年来的代表性数据集。它们中大多数都是高质量和大规模的数据集，在不同的拍摄场景中都有良好的注释。图像级2D单人数据集（待补充）图像级2D多人数据集（待补充）视频级2D单人数据集（待补充）3D单人数据集Human3.6MHuman3.6M是使用最广泛的多视图单人三维人体姿态基准。该数据集使用4个RGB摄像机、1个飞行时间传感器和1
复制链接

扫一扫

专栏目录