一文多图搞懂KITTI检测数据集下载使用(附网盘链接)

最新推荐文章于 2025-03-08 08:51:38 发布

小鹏聊智驾

最新推荐文章于 2025-03-08 08:51:38 发布

阅读量1.4w

点赞数 58

分类专栏：数据集文章标签： KITTI 数据集

本文链接：https://blog.csdn.net/chiyukunpeng/article/details/105668276

版权

数据集专栏收录该内容

1 篇文章

订阅专栏

文章目录

前言

KITTI 是自动驾驶领域最著名的数据集，本文不做科普，只讲干货！！！话不多说，进入正题，看完本文，你将得到网盘下载地址，数据集使用说明，足够你复现别人的工作，进而开展自己的工作！

1 下载

如下图，大家根据自己工作的需要，自行选择要下载的内容，别急，马上送上网盘链接
在这里插入图片描述
本文的最大福利来啦，以上数据集的网盘链接分享给大家，拿走不谢，好心人点个赞即可。
链接：https://pan.baidu.com/s/1oc1hzIEer3MNeV6gHR2OTA
提取码：qifd

2 说明

本节给大家解读一下我们下载的数据。

2.1 devkit_object

目录结构如下

devkit_object
├── cpp
├── mapping
├── matlab
└── readme.txt

这是 KITTI 官方提供的开发套件以及使用说明，本文将取其精华，去其糟粕。

2.2 data_object_calib

目录结构如下

data_object_calib
├── testing
│   └── calib
└── training
    └── calib

这些文件夹分别存放着训练集以及测试集每个样本的标定数据，其中测试集7518个，训练集7481个。
每个样本的标定文件如下图所示，此处坐标系转换理论详见【点云处理】坐标系转换。
官方的 readme 也给出了说明：
To project a point from Velodyne coordinates into the left color image,
you can use this formula: x = P2 * R0_rect * Tr_velo_to_cam * y
For the right color image: x = P3 * R0_rect * Tr_velo_to_cam * y
显然，从雷达坐标系转到 2 号相机坐标系用到了 R(3x3的旋转矩阵) 以及 T(3x1的平移矩阵)。
在这里插入图片描述

2.3 data_object_label_2

目录结构如下

data_object_label_2
├── training
    └── label_2

这是标注文件，是的，你没看错，只有训练集的标注，没有测试集的，原因你懂的。
下图是某样本的标注文件，这里具体含义官方也给了说明：
在这里插入图片描述

注意：这里的 DontCare 标签代表没有标注的目标，原因可能是距离太远已经超出激光雷达的检测范围了，没有意义。此外，在 2D 与 3D Detection Benchmark 中只针对 Car，Pedestrain, Cyclist 这三类。

2.4 data_object_image_2

目录结构如下

data_object_image_2 
|── testing 
│ └── image_2 
└── training 
  └── image_2

这是 RGB 数据，分为测试集与训练集。

2.5 data_object_velodyne

这是激光雷达点云数据，点云数据被保存为二进制文件，每个点包含 3 个坐标和反射率信息，即 (x,y,z,r)。

3 使用

这必须依据你的工作需要，合理安排数据组织形式，这里提供一个 3D 检测工作 F-PointNet 的数据组织形式。

data/kitti
├── testing
│   ├── calib
│   ├── image_2
│   └── velodyne
└── training
    ├── calib
    ├── image_2
    ├── label_2
    └── velodyne

一文多图搞懂KITTI检测数据集下载使用(附网盘链接)

文章目录

前言

1 下载

2 说明

2.1 devkit_object

2.2 data_object_calib

2.3 data_object_label_2

2.4 data_object_image_2

2.5 data_object_velodyne

3 使用

相关传送门