<center><font size=6 face="黑体">Kitti数据集相应参数说明</font></center>
1、数据的制作设备及一些参数说明:
1)4路相机:
camera_0:左边灰度相机,<font color='red'>参考相机</font>
camera_1:右边灰度相机
camera_2:左边彩色相机
camera_3:右边彩色相机
2)一个激光雷达:用于生成点云数据
3)camera_0与camera_2、camera_1与camera_3的距离为0.06米
4)camera_0与camera_1、camera_2与camera_3的距离为0.54米
5)4路相机的高度都为1.65米
6)激光雷达的高度为1.73米
7)坐标系说明:
相机坐标系: x = right, y = down, z = forward
点云坐标系: x = forward, y = left, z = up
2、数据文件解释
2.1 label txt
1)第1个值:代表类别,可以为['Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' , 'DontCare']
2)第2个值:代表物体是否被截断,从0到1浮动,0表示没被截断,1表示完全被截断,即超出图像范围
3)第3个值:代表物体是否被遮挡,表示为整数0(完全可见)、1(小部分遮挡)、2(大部分遮挡)、3(完全遮挡)
4)第4个值:代表物体的观察角度,可参考<font color=blue>这篇博客</font>的解释
5)第5~8个值:代表物体的2D bounding box,分别为xmin、ymin、xmax、ymax
6)第9~11个值:代表物体的高宽长(hwl)(单位:米)
7)第12~14个值:代表3D bounding box的中心坐标(相机坐标系下)
2.2 point cloud file
一个bin文件为一张图像的相应点云,保存为Nx4的形式,4为(x, y, z, ref),x, y, z为相应的坐标(点云坐标系下),ref为反射率
2.3 calib txt
1)P0:3x4,3x3为相机内参,最后一列为全0,对P0来说无意义
2)P1:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_1图像坐标的映射
3)P2:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_2图像坐标的映射
4)P3:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_3图像坐标的映射
5)R0_rect:3x3,参考坐标的校准旋转矩阵。校准是使多路相机的图像在同一个平面上
6)Tr_velo_to_cam:点云坐标到参考坐标(即camera_0坐标系)的映射矩阵
示例:
1、将label文件中的3D bounding box转换到图像坐标(以映射到左彩图为例):
y_image = P2 * R0_rect * R0_rot * x_ref_coord
注:R0_rot为物体坐标到参考坐标的映射矩阵
2、将点云坐标映射到图像坐标(以映射到左彩图为例):
y_image = P2 * R0_rect * Tr_velo_to_cam * x_velo_coord
参考连接:
1、博客https://medium.com/test-ttile/kitti-3d-object-detection-dataset-d78a762b5a4
2、kitti官方论文http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf