2.1 COCO数据集
2.2 VOC数据集
2.3 Cityscapes数据集
整个数据集包含50个欧洲城市,5000张精细标注图像(标注位于gtFine文件夹,2975张train(就是这部分图像用来训练),500张val,1525张test,19个分类类别),以及20000张非精细标注图像(标注位于gtCoarse文件夹),源图大小都是1024x2048(hxw)
- leftImg8bit(11G),放置训练源图,按城市分子文件夹,存放png图片
- gtFine(241M),放置精细标注文件,按城市分子文件夹,存放png/json文件
- gtCoarse(1.3G),放置非精细标注的文件(该文件夹不是必须,可不使用)
- cityscapesscripts,放置处理脚本(该文件夹不是必须,可不使用)
文件夹leftImg8bit:先分train/val/test三个文件夹,每个文件夹下又按城市分子文件夹,每个城市文件夹下就是源图png文件。 - 文件夹gtFine:先分train(18个城市)/val(3个城市)/test(6个城市)三个文件夹,每个文件夹下又按城市分子文件夹,每个城市文件夹下针对每张源图png文件对应了6张标注文件:
- xxx_gtFine_color.png 代表可视化的分割图,一般不用
- xxx_gtFine_instanceIds.png 代表实例分割标注文件
- xxx_gtFine_instanceTrainIds.png 代表实例
- xxx_gtFine_labelIds.png 代表每个实例的标签id标注
- xxx_gtFine_labelTrainIds.png
- xxx_gtFine_polygons.json
kitti数据集介绍
- image_00:左侧灰度相机图像序列
- image_01:右侧灰度相机图像序列
- image_02:左侧彩色相机图像序列
- image_03:右侧彩色相机图像序列
- oxts:GPS/IMU位姿相关信息序列
- velodyne_points:激光雷达数据序列
oxts文件夹下:
数据文件
数据介绍
时间戳文件
velodyne_points文件夹
data: 包含有雷达扫描到的数据,点云形式,每个点以 (x,y,z,i) 格式存储,i为反射值
时间戳文件:start+end/2中心时间文件 start文件 end文件
calib文件:
1、calib_cam_to_cam.txt,包含各相机的标定参数
- S_xx: 1x2 矫正前xx号相机的图片尺寸
- K_xx: 3x3 矫正前xx号相机的标定参数
- D_xx: 1x5 矫正前xx号相机的畸变系数
- R_xx: 3x3 外参,xx号相机的旋转矩阵
- T_xx: 3x1 外参,xx号相机的平移矩阵
- S_rect_xx: 1x2 矫正后XX号相机的图片尺寸
- R_rect_xx: 3x3 旋转矩阵,用于矫正xx号相机,使得图像平面共面(原话是make image planes co-planar)。
- P_rect_0x: 3x4 投影矩阵,用于从矫正后的0号相机坐标系 投影到 X号相机的图像平面。
2、calib_velo_to_cam.txt,从雷达坐标系到0号相机坐标系的转换
R: 3x3 旋转矩阵
T: 3x1 平移矩阵
delta_f 和delta_c 已被弃用
- (R|T) : 雷达坐标系 -> 0号相机坐标系
- R_rect_00: 0号相机坐标系 -> 矫正后的0号相机坐标系
- P_rect_0x: 矫正后的0号相机坐标系 -> x号相机的图像平面