无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

MODNet: Moving Object Detection Network with Motion and Appearance for Autonomous Driving

这里讲视频动作识别中的 two stream networks 框架应用于无人驾驶中的目标检测,视频分析中的 motion and appearance cues
这里写图片描述

本文的 contributions 主要以下三点:
1)提出了一个新颖的多任务学习系统用于无人驾驶,它可以融合 motion and appearance cues
2)这个系统同时检测车辆和运动分割
3)我们提出了一个方法,可以将 KITTI dataset 转出本系统需要的训练数据,我们称得到的数据库为 KITTI MOD

下面首先来看看 KITTI MOD Dataset 的生成
这里写图片描述
对于车辆我们主要利用了 odometry information and annotated 3D bounding boxes ,odometry information 可以帮助我们将相机的速度得到。从 3D bounding boxes 我们可以得到 2D bounding boxes,根据 3D centroids 我们可以估算出车辆的速度,根据这个速度结合相机的速度,我们可以判断出车辆是否运动。我们可以将运动车辆区分出来。

MODNet Two Stream Multi-Task Learning Architecture
这里写图片描述
采用 VGG16 网络,输入 RGB图像和 光流场

A detector similar to the detection decoder in [26] denoted as FastBox is used. It is based on Yolo[22] as a single shot detector utilizing the first 15 convolutional layers from VGG16
损失函数定义如下
这里写图片描述

Experiment

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值