MicroSoft Kinect Camera to Make Datasets

本文介绍了多个使用Microsoft Kinect相机捕获的动作识别和人体检测数据集,包括G3D、UTKinect-Action3D、FLORENCE 3D ACTIONS DATASET、MSR Action3D和NTU RGB+D Action Recognition Dataset。这些数据集包含同步的RGB、深度和骨架数据,用于研究3D动作识别和人体检测。每个数据集提供了详细的描述、数据格式和可用资源。
摘要由CSDN通过智能技术生成

Gaming Datasets(G3D)
http://dipersec.king.ac.uk/G3D/G3D.html
G3D 描述

  • G3D数据集包含使用Microsoft Kinect捕获的一系列游戏操作。Kinect使我们能够记录同步的视频,深度和骨架数据。该数据集包含10个主题,执行20个游戏动作:右拳,左拳,右踢,左踢,防守,高尔夫挥杆,正手网球挥手,网球挥手反手,网球发球,投掷保龄球,瞄准和消防枪,步行,跑步,跳跃,攀爬,蹲伏,驾驶汽车,挥动,拍打和鼓掌。
  • 20个游戏动作记录在7个动作序列中,如表1所示。大多数序列在受控室内环境中包含具有固定摄像机的多个动作,这是基于姿势的游戏的典型设置。如表2所示,每个受试者重复每个序列三次。
    数据格式:
  • 由于选择了格式,因此无需任何特殊软件工具即可查看所有记录的数据和元数据。在镜像视图中以30fps记录三个流。深度和彩色图像存储为640x480 PNG文件,骨架数据存储在XML文件中。
  • 对于每个序列,我们将每个帧记录为颜色,原始深度和深度转换为PNG格式的颜色坐标(参见图1)。原始深度信息包含以毫米为单位的每个像素的深度,并以16位灰度存储,原始颜色以24位RGB存储。深度信息也映射到颜色坐标空间并以16位灰度存储。16位深度数据包含13位深度数据和3位识别播放器。玩家索引可用于按用户分割深度图(参见图2)。
  • 此外,我们还以XML格式记录了每个帧的骨架数据。XML文件中的根节点是一个骨架数组,以允许数据集的未来版本包含多个主题。每个骨架都包含玩家的位置和姿势。姿势包括Microsoft定义的20个关节。玩家和关节位置以X,Y和Z坐标给出,单位为米。这些位置也映射到深度和颜色坐标空间。骨架数据包括联合跟踪状态,在图3中显示为跟踪(绿色),推断(黄色)和未跟踪(红色)。
  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

UTKinect-Action3D Dataset
UTKinect-Action3D Dataset

介绍
该数据集是作为深度序列动作识别研究工作的一部分收集的。该研究在CVPRW 2012论文中使用3D关节直方图查看不变人类行为识别中进行了详细描述
数据集
这些视频是使用一个固定的Kinect和Kinect for Windows SDK Beta版本捕获的。有10种动作类型:走路,坐下,站起来,拿起,携带,扔,推,拉,挥手,拍手。 有10个科目,每个科目每次执行两次。记录了三个通道:RGB,深度和骨架关节位置。三个通道是同步的。帧速率为30f / s。请注意,我们仅在跟踪骨架时记录帧,文件的帧编号已跳转。最终帧速率约为15f / sec。(大约2%的框架中存在多个骨架信息,其中记录的关节位置略有不同。这不是由第二个人造成的。您可以选择任何一个。)

在这里插入图片描述

每个视频中,主题以连接的形式执行10个动作,每个动作片段的标签在actionLabel.txt中给出。数据集包含4个部分:

(a)RGB图像(.jpg),分辨率为480x640。 下载(1.79G)

(b)深度图像(.xml),分辨率为320x240。它们使用OpenCV保存。 下载(367M)

(c)Sketetal joint Locations(.txt)每行包含一帧的数据,第一个数字是帧号,下面的数字是1-20联合的(x,y,z)位置。x,y和z是相对于传感器阵列的坐标,以米为单位。坐标的详细描述中,可以发现在这里 的接缝的索引被描述在这里。 下载(3.3M)

(d)行动标签(4KB)

FLORENCE 3D ACTIONS DATASET
FLORENCE 3D ACTIONS DATASET
2012年在佛罗伦萨大学收集的数据集已使用Kinect相机拍摄。它包括9项活动:波浪,从瓶子里喝,接听电话,拍手,紧身蕾丝,坐下,站起来,看书,弓。在获取期间,要求10名受试者进行上述动作2/3次。这导致总共215个活动样本。

注意:数据集可以免费下载并用于研究(非营利)目的。使用此数据集的出版物必须参考以下工作:L。Seidenari,V。Varano,S。Berretti,A。Del Bimbo,P。Pala。“认识到深度相机的行动是弱对齐的多部分袋子”,第三届人类活动理解国际研讨会,来自3D数据(HAU3D’13),与CVPR 2013,俄勒冈州波特兰市,2013年6月24日。

MSR Action3D
MSR Action3D

MSR-Action3D数据集包含20个动作:高臂波、水平臂波、锤、手抓、向前冲、高抛、画x、画勾、画圆、手拍、双手波、侧拳、弯、前踢、侧踢、慢跑、网球挥杆、网球发球、高尔夫挥杆、拾取、拾取、扔。有10个实验对象,每个实验对象要做2到3次动作。总共有567个深度图序列。

NTU RGB+D Action Recognition Dataset
NTU RGB+D Action Recognition Dataset
NTU RGB+D行动识别数据集包含了56,880个包含RGB视频、深度图序列、3D骨骼数据和每个样本的红外视频动作。这个数据集被3个微软Kinect v2相机同时捕获。RGB视频的分辨率为1920x1080,深度图和IR视频均为512x424,三维骨骼数据包含每一帧的25个主要身体关节的三维位置。

COCO Body Detection Datasets
COCO Body Detection Datasets

COCO数据集标注详解https://blog.csdn.net/wc781708249/article/details/79603522
COCO数据集下载

https://www.aiuai.cn/aifarm931.html
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip

MPII Body Dataset
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1.tar.gz
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_u12_2.zip

http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_sequences_batch1.tar.gz
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_sequences_batch2.tar.gz

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值