Jacuard数据集常被翻译为提花数据集。用于机器人抓取检测的大规模数据集
数据集地址:JACQUARD DATASET
数据集内容
提花数据集由来自 54 485 个不同对象的 11 619 个不同场景组成,共有 4 967 454 个抓取注释(1 181 330 个唯一位置)。对于每个场景,都提供了一个渲染的RGB图像,一个分割蒙版,两个深度图像和抓取注释。
文件内容
每个可下载的 zip 文件都包含数据集的独立子部分,因此您可以像处理整个数据集一样处理 10 个演示对象。提取后,数据集的结构如下:
- nameOfObject1:包含对象所有数据的文件夹。该名称与 ShapenetSem 数据集一致。此文件夹中的所有文件都以 * = i_nameOfObject1 为前缀,其中 i 是当前对象的场景索引(介于 0 和 4 之间)。
- *_grasps.txt:带有 grasps 注释的文本文件。文件中的每一行都是一个抓握,写成 x;y;theta 以度为单位(根据个人理解,如有错误理解,🙏欢迎纠正。其中一行数据601.04479;540.7194;51.7276;24.0;26.8424,可以通过分号进行分割并解释每个数值的含义:x坐标:601.04479y坐标:540.7194z坐标:51.7276rx(x轴旋转角度):24.0ry(y轴旋转角度):26.8424这些数值描述了一个抓取姿态的位置和朝向。x、y、z坐标表示抓取位置的具体位置,而rx和ry表示抓取的旋转角度。)
- *_mask.png:带有对象的二进制掩码(0表示背景)的PNG图像,可用于对数据执行背景增强。
- *_perfect_depth.tiff:具有完美深度图像的float32 tiff图像。
- *_RGB.png:使用Blender渲染的场景的PNG图像。
- *_stereo_depth.tiff:一个float32 tiff图像,其深度来自现成的立体视觉算法。深度不确定的像素(由于立体视觉过程中的遮挡或匹配不良)的值为 -1。
- 名称对象2
- *_grasps.txt
- *_mask.png
- *_perfect_depth.tiff
- *_RGB.png
- *_stereo_depth.tiff
- 名称对象3
- *_grasps.txt
- *_mask.png
- *_perfect_depth.tiff
- *_RGB.png
- *_stereo_depth.tiff
- ...
打开 Jacuard如下,12个文件夹