文章目录
前言
KITTI 是自动驾驶领域最著名的数据集,本文不做科普,只讲干货!!!话不多说,进入正题,看完本文,你将得到网盘下载地址,数据集使用说明,足够你复现别人的工作,进而开展自己的工作!
1 下载
如下图,大家根据自己工作的需要,自行选择要下载的内容,别急,马上送上网盘链接
本文的最大福利来啦,以上数据集的网盘链接分享给大家,拿走不谢,好心人点个赞即可。
链接:https://pan.baidu.com/s/1oc1hzIEer3MNeV6gHR2OTA
提取码:qifd
2 说明
本节给大家解读一下我们下载的数据。
2.1 devkit_object
目录结构如下
devkit_object
├── cpp
├── mapping
├── matlab
└── readme.txt
这是 KITTI 官方提供的开发套件以及使用说明,本文将取其精华,去其糟粕。
2.2 data_object_calib
目录结构如下
data_object_calib
├── testing
│ └── calib
└── training
└── calib
这些文件夹分别存放着训练集以及测试集每个样本的标定数据,其中测试集7518个,训练集7481个。
每个样本的标定文件如下图所示,此处坐标系转换理论详见【点云处理】坐标系转换。
官方的 readme 也给出了说明:
To project a point from Velodyne coordinates into the left color image,
you can use this formula: x = P2 * R0_rect * Tr_velo_to_cam * y
For the right color image: x = P3 * R0_rect * Tr_velo_to_cam * y
显然,从雷达坐标系转到 2 号相机坐标系用到了 R(3x3的旋转矩阵) 以及 T(3x1的平移矩阵)。
2.3 data_object_label_2
目录结构如下
data_object_label_2
├── training
└── label_2
这是标注文件,是的,你没看错,只有训练集的标注,没有测试集的,原因你懂的。
下图是某样本的标注文件,这里具体含义官方也给了说明:
注意:这里的 DontCare 标签代表没有标注的目标,原因可能是距离太远已经超出激光雷达的检测范围了,没有意义。此外,在 2D 与 3D Detection Benchmark 中只针对 Car,Pedestrain, Cyclist 这三类。
2.4 data_object_image_2
目录结构如下
data_object_image_2
|── testing
│ └── image_2
└── training
└── image_2
这是 RGB 数据,分为测试集与训练集。
2.5 data_object_velodyne
这是激光雷达点云数据,点云数据被保存为二进制文件,每个点包含 3 个坐标和反射率信息,即 (x,y,z,r)。
3 使用
这必须依据你的工作需要,合理安排数据组织形式,这里提供一个 3D 检测工作 F-PointNet 的数据组织形式。
data/kitti
├── testing
│ ├── calib
│ ├── image_2
│ └── velodyne
└── training
├── calib
├── image_2
├── label_2
└── velodyne
相关传送门
陌生人,祝你数据集玩得愉快,效果都是 SOTA,点个赞再走呗。