实践一:利用SSD-tensorflow训练kitti数据集

kitti数据集介绍

数据描述
KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。整个数据集由389对立体图像和光流图,39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成 ,以10Hz的频率采样及同步。总体上看,原始数据集被分类为 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,’Person_sitting’ ,’Misc’和 ‘Dontcare’。对于3D物体检测,label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc组成。
数据制作
为数据集设置2个类别, ‘Car’,’Pedestrian’,将 ‘Van’, ‘Truck’, ‘Tram’,’Cyclist’,合并到 ‘Car’类别中去,将 ‘Person_sitting’合并到 ‘Pedestrian’类别中去(’Misc’和 ‘Dontcare’这两类直接忽略)
这里写图片描述

SSD代码测试

代码地址:https://github.com/balancap/SSD-Tensorflow
1 制作数据集
kitti图片总量是7481张,按照voc格式,把图片放在JPEGImages目录下,xml格式的文件放在Annotations目录下。
2 voc转tfrecords
voc格式的数据集制作好以后,我们需要把数据集转换成tfrecords
这里写图片描述
3,修改num_classes

4,进行训练
这里写图片描述

SSD-tensorflow存在问题

1,出现内存不足,需要将batch改为16
2,计算得到的损失结果一直在20左右摆动[调参均失败]

检测结果

SSD-tensorflow检测速度【显卡为1070】:44.068fps
这里写图片描述

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值