实践一：利用SSD-tensorflow训练kitti数据集

最新推荐文章于 2024-05-29 00:49:29 发布

3602138103

最新推荐文章于 2024-05-29 00:49:29 发布

阅读量4.4k

点赞数 2

分类专栏：深度学习学习笔记深度学习之图像处理

本文链接：https://blog.csdn.net/qq_27163197/article/details/80422205

版权

深度学习之图像处理同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

深度学习学习笔记

11 篇文章 0 订阅

订阅专栏

kitti数据集介绍

数据描述
KITTI包含市区、乡村和高速公路等场景采集的真实图像数据，每张图像中最多达15辆车和30个行人，还有各种程度的遮挡与截断。整个数据集由389对立体图像和光流图，39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成，以10Hz的频率采样及同步。总体上看，原始数据集被分类为 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,’Person_sitting’ ,’Misc’和 ‘Dontcare’。对于3D物体检测，label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc组成。
数据制作
为数据集设置2个类别， ‘Car’，’Pedestrian’，将 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,合并到 ‘Car’类别中去，将 ‘Person_sitting’合并到 ‘Pedestrian’类别中去（’Misc’和 ‘Dontcare’这两类直接忽略）
这里写图片描述

SSD代码测试

代码地址：https://github.com/balancap/SSD-Tensorflow
1 制作数据集
kitti图片总量是7481张，按照voc格式，把图片放在JPEGImages目录下，xml格式的文件放在Annotations目录下。
2 voc转tfrecords
voc格式的数据集制作好以后，我们需要把数据集转换成tfrecords
这里写图片描述
3，修改num_classes

4，进行训练