MicroSoft Kinect Camera to Make Datasets

最新推荐文章于 2022-12-17 20:22:24 发布

蜗牛me

最新推荐文章于 2022-12-17 20:22:24 发布

阅读量1.4k

点赞数 1

分类专栏：数据集文章标签： Body detection datasets

原文链接：http://dipersec.king.ac.uk/G3D/G3D.html

版权

数据集专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文介绍了多个使用Microsoft Kinect相机捕获的动作识别和人体检测数据集，包括G3D、UTKinect-Action3D、FLORENCE 3D ACTIONS DATASET、MSR Action3D和NTU RGB+D Action Recognition Dataset。这些数据集包含同步的RGB、深度和骨架数据，用于研究3D动作识别和人体检测。每个数据集提供了详细的描述、数据格式和可用资源。

摘要由CSDN通过智能技术生成

Gaming Datasets(G3D)
http://dipersec.king.ac.uk/G3D/G3D.html
G3D 描述

G3D数据集包含使用Microsoft Kinect捕获的一系列游戏操作。Kinect使我们能够记录同步的视频，深度和骨架数据。该数据集包含10个主题，执行20个游戏动作：右拳，左拳，右踢，左踢，防守，高尔夫挥杆，正手网球挥手，网球挥手反手，网球发球，投掷保龄球，瞄准和消防枪，步行，跑步，跳跃，攀爬，蹲伏，驾驶汽车，挥动，拍打和鼓掌。
20个游戏动作记录在7个动作序列中，如表1所示。大多数序列在受控室内环境中包含具有固定摄像机的多个动作，这是基于姿势的游戏的典型设置。如表2所示，每个受试者重复每个序列三次。
数据格式：
由于选择了格式，因此无需任何特殊软件工具即可查看所有记录的数据和元数据。在镜像视图中以30fps记录三个流。深度和彩色图像存储为640x480 PNG文件，骨架数据存储在XML文件中。
对于每个序列，我们将每个帧记录为颜色，原始深度和深度转换为PNG格式的颜色坐标（参见图1）。原始深度信息包含以毫米为单位的每个像素的深度，并以16位灰度存储，原始颜色以24位RGB存储。深度信息也映射到颜色坐标空间并以16位灰度存储。16位深度数据包含13位深度数据和3位识别播放器。玩家索引可用于按用户分割深度图（参见图2）。
此外，我们还以XML格式记录了每个帧的骨架数据。XML文件中的根节点是一个骨架数组，以允许数据集的未来版本包含多个主题。每个骨架都包含玩家的位置和姿势。姿势包括Microsoft定义的20个关节。玩家和关节位置以X，Y和Z坐标给出，单位为米。这些位置也映射到深度和颜色坐标空间。骨架数据包括联合跟踪状态，在图3中显示为跟踪（绿色），推断（黄色）和未跟踪（红色）。

UTKinect-Action3D Dataset
UTKinect-Action3D Dataset

介绍
该数据集是作为深度序列动作识别研究工作的一部分收集的。该研究在CVPRW 2012论文中使用3D关节直方图查看不变人类行为识别中进行了详细描述
数据集
这些视频是使用一个固定的Kinect和Kinect for Windows SDK Beta版本捕获的。有10种动作类型：走路，坐下，站起来，拿起，携带，扔，推，拉，挥手，拍手。有10个科目，每个科目每次执行两次。记录了三个通道：RGB，深度和骨架关节位置。三个通道是同步的。帧速率为30f / s。请注意，我们仅在跟踪骨架时记录帧，文件的帧编号已跳转。最终帧速率约为15f / sec。（大约2％的框架中存在多个骨架信息，其中记录的关节位置略有不同。这不是由第二个人造成的。您可以选择任何一个。）

在这里插入图片描述

每个视频中，主题以连接的形式执行10个动作，每个动作片段的标签在actionLabel.txt中给出。数据集包含4个部分：

（a）RGB图像（.jpg），分辨率为480x640。下载（1.79G）

（b）深度图像（.xml），分辨率为320x240。它们使用OpenCV保存。下载（367M）

（c）Sketetal joint Locations（.txt）每行包含一帧的数据，第一个数字是帧号，下面的数字是1-20联合的（x，y，z）位置。x，y和z是相对于传感器阵列的坐标，以米为单位。坐标的详细描述中，可以发现在这里的接缝的索引被描述在这里。下载（3.3M）

（d）行动标签（4KB）

FLORENCE 3D ACTIONS DATASET
FLORENCE 3D ACTIONS DATASET
2012年在佛罗伦萨大学收集的数据集已使用Kinect相机拍摄。它包括9项活动：波浪，从瓶子里喝，接听电话，拍手，紧身蕾丝，坐下，站起来，看书，弓。在获取期间，要求10名受试者进行上述动作2/3次。这导致总共215个活动样本。

注意：数据集可以免费下载并用于研究（非营利）目的。使用此数据集的出版物必须参考以下工作：L。Seidenari，V。Varano，S。Berretti，A。Del Bimbo，P。Pala。“认识到深度相机的行动是弱对齐的多部分袋子”，第三届人类活动理解国际研讨会，来自3D数据（HAU3D’13），与CVPR 2013，俄勒冈州波特兰市，2013年6月24日。

MSR Action3D
MSR Action3D

MSR-Action3D数据集包含20个动作:高臂波、水平臂波、锤、手抓、向前冲、高抛、画x、画勾、画圆、手拍、双手波、侧拳、弯、前踢、侧踢、慢跑、网球挥杆、网球发球、高尔夫挥杆、拾取、拾取、扔。有10个实验对象，每个实验对象要做2到3次动作。总共有567个深度图序列。

NTU RGB+D Action Recognition Dataset
NTU RGB+D Action Recognition Dataset
NTU RGB+D行动识别数据集包含了56,880个包含RGB视频、深度图序列、3D骨骼数据和每个样本的红外视频动作。这个数据集被3个微软Kinect v2相机同时捕获。RGB视频的分辨率为1920x1080，深度图和IR视频均为512x424，三维骨骼数据包含每一帧的25个主要身体关节的三维位置。

COCO Body Detection Datasets
COCO Body Detection Datasets

COCO数据集标注详解：https://blog.csdn.net/wc781708249/article/details/79603522
COCO数据集下载

https://www.aiuai.cn/aifarm931.html
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip

MPII Body Dataset
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1.tar.gz
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_u12_2.zip

http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_sequences_batch1.tar.gz
http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_sequences_batch2.tar.gz

蜗牛me

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
MicroSoft Kinect Camera to Make Datasets

Gaming Datasets(G3D)http://dipersec.king.ac.uk/G3D/G3D.htmlG3D 描述G3D数据集包含使用Microsoft Kinect捕获的一系列游戏操作。Kinect使我们能够记录同步的视频，深度和骨架数据。该数据集包含10个主题，执行20个游戏动作：右拳，左拳，右踢，左踢，防守，高尔夫挥杆，正手网球挥手，网球挥手反手，网球发球，投掷保龄球...
复制链接

扫一扫

专栏目录