#每天一篇论文 255/365 Triangulation Learning Network: from Monocular to Stereo 3D Object Detection

三角几何学习网络:从单目到立体的三维目标检测

原文

摘要

本文研究了从立体图像中检测三维目标的问题,其中的关键问题是如何有效地利用立体信息。与以往使用像素级深度图的方法不同,我们提出了利用三维锚定来显式地构造立体图像感兴趣区域之间的对象级对应关系,从而学习在三维空间中检测和三角化目标。我们还引入了一种成本效益高的信道加权策略,该策略增强了表示特征,削弱了噪声信号,以便于学习过程。所有这些都被灵活地集成到使用单目图像的固体基线检测器中。我们证明,在具有挑战性的kitti数据集上,单目基线和立体三角剖分学习网络在三维目标检测和定位方面都优于现有技术。

贡献

为了检验我们的设计,我们首先提出了一个固定基线单目三维探测器,其概述如图1所示。结合tlnet,我们证明了在不同的场景下,三维目标检测和定位都能取得显著的改进。此外,我们还对tlnet中的特征重加权策略进行了定量分析,以更好地了解其效果。总之,我们的贡献有三方面:
•仅以单眼图像为输入的立体基线3D探测器,其性能与最先进的立体探测器相当。
•利用立体图像的几何相关性来定位目标三维物体的三角测量学习网络,在具有挑战性的Kitti[8]数据集上,该网络的性能大大优于基线模型。
•一种特征重新称重策略,增强特定于视图的ROI特征的信息通道,通过将网络注意力偏向对象的关键部分,有利于三角测量学习。

方法

以单目图像为输入的基线网络由主干网和三个后续模块组成,即前视图锚定生成、3d盒的提出和细化。三段流水线通过选择置信锚来逐步减少搜索空间,这大大降低了计算复杂度。
提出了一种利用立体信息进行精确三维目标检测的新网络。我们建立了一个坚实的基线单目检测器,灵活地扩展到立体声结合提出的TLNET。其核心思想是在立体图像中利用三维锚构造投影之间的几何对应关系,从而使网络学会在前向过程中对目标物体进行三角化。文中还介绍了一种有效的信道重加权方法来增强信息特征,削弱噪声信号。所有这些都集成到我们的基线检测器中,并实现最先进的性能。
在这里插入图片描述

结果

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值