自动驾驶--Visual-Inertial-Semantic Scene Representation for 3D object Detection (一 )

声明:

1)本文为论文阅读记录,主要用于分享和学术交流
2)若有错误,欢迎各位大牛吐槽,如有版权问题请联系:874870841@qq.com

**

这篇文章是UCLA Vision lab, University of California, 的 jingming Dong, Xiaohan Fei, 以及 Stefano Soatto 的文章,目前还是在arXiv.org.
文章链接如下 :
https://arxiv.org/pdf/1606.03968
该团队有一个类似的工作”VL-SLAM: Real-Time Visual-Inertial Navigation and Semantic Mapping” 发表在CVPR 2016 的demoPoster
相对CVPR2016 的工作,该文章给原来提出的3D bounding box 位置添加了 CAD model.

主要创新点:
通过结合IMU + SLAM + CNN 识别出场景中的物体(类别,尺寸,朝向)
1. 其中VIO 用于场景的定位以及尺度的获取,(例如避免将尺度相差很大的模型车识别成真是的车)
2. CNN (RBG 大神的YOLO)用于语义的识别, 结合几何信息进行3D object 的识别
3. 识别的物体即使被障碍物遮挡,被遮挡物体仍然存在(视频中用虚线框出)(相当于数据关联)

以下是两篇文章的效果:
第一张图为CVPR2016 demoPoster 的效果:


CVPR2016 demoPoster:

第二张图为CVPR2016 demoPoster 的效果:


这里写图片描述
两个效果都能区分出玩具车和真是车辆,不仅如此,还恢复出车辆在空间中的位姿。

以下是该文章都是相对 sub-CNN 的定量比较:


这里写图片描述

相对 sub-CNN 的定性比较:


这里写图片描述

文章和公式还在阅读和推导中,后续请继续关注!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值