在这项工作中,我们提出PointRCNN 3D对象检测器,以自下而上的方式直接从原始点云中生成准确的3Dbox建议,然后通过基于bin的3Dbox回归损失在规范坐标中对其进行完善。 据我们所知,PointRCNN是第一个通过仅使用原始点云作为输入进行3D对象检测的two-stage 3D对象检测器。 PointRCNN在KITTI数据集上进行了评估,并在提交时在所有已发表作品中在KITTI 3D对象检测排行榜上达到了最先进的性能。
object:label,image(图像仅用于可视化),calib,velodyne
以下这篇博文会有较为详尽的解释,是我通过不断筛选出的个人感觉较为优质的相关解析文档。
https://blog.csdn.net/lovely_yoshino/article/details/105814646?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase
下面这一篇对其中的参数做了很详尽的解释说明(各个文件的解析)
https://blog.csdn.net/cuichuanchen3307/article/details/80596689?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase
1.雷达点云是以二进制形式存储,后缀为.bin
每行数据表示一个雷达点:x y z intensity,其中(x,y,z)单位为米,intensity为回波强度,范围在0~1.0之间
2.图像数据是以.png格式存储,可直接查看
3.KITTI中雷达点云与图像的配准关系存放在calib.txt中
label
对于Object检测,训练集合的标签数据在文件:data_object_label_2.zip中,其中, 每一帧对应一个标注的.txt文件
下面这篇博文为kitti 3Dobject检测数据集的使用与说明
https://blog.csdn.net/hit1524468/article/details/79766805?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase
关于KITTI数据集
1.对于3D物体检测,label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc组成。
2.KITTI数据集的数据采集平台装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne 64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。
3.数据集中labe(标签数据)和calib(相机矫正数据)解析
https://blog.csdn.net/KYJL888/article/details/82844823)
4.kitti数据集中的label,calib,velodyne等分别代表什么数据?
分别代表人工标注的真值、相机和激光雷达的标定信息和激光雷达扫到的点云。