#每天一篇论文 255/365 Triangulation Learning Network: from Monocular to Stereo 3D Object Detection

最新推荐文章于 2020-12-01 11:43:52 发布

流浪机器人

最新推荐文章于 2020-12-01 11:43:52 发布

阅读量675

点赞数

分类专栏：每天一篇论文365

本文链接：https://blog.csdn.net/qq_26623879/article/details/102810200

版权

每天一篇论文365 专栏收录该内容

146 篇文章 73 订阅

订阅专栏

三角几何学习网络：从单目到立体的三维目标检测

原文

摘要

本文研究了从立体图像中检测三维目标的问题，其中的关键问题是如何有效地利用立体信息。与以往使用像素级深度图的方法不同，我们提出了利用三维锚定来显式地构造立体图像感兴趣区域之间的对象级对应关系，从而学习在三维空间中检测和三角化目标。我们还引入了一种成本效益高的信道加权策略，该策略增强了表示特征，削弱了噪声信号，以便于学习过程。所有这些都被灵活地集成到使用单目图像的固体基线检测器中。我们证明，在具有挑战性的kitti数据集上，单目基线和立体三角剖分学习网络在三维目标检测和定位方面都优于现有技术。

贡献

为了检验我们的设计，我们首先提出了一个固定基线单目三维探测器，其概述如图1所示。结合tlnet，我们证明了在不同的场景下，三维目标检测和定位都能取得显著的改进。此外，我们还对tlnet中的特征重加权策略进行了定量分析，以更好地了解其效果。总之，我们的贡献有三方面：
•仅以单眼图像为输入的立体基线3D探测器，其性能与最先进的立体探测器相当。
•利用立体图像的几何相关性来定位目标三维物体的三角测量学习网络，在具有挑战性的Kitti[8]数据集上，该网络的性能大大优于基线模型。
•一种特征重新称重策略，增强特定于视图的ROI特征的信息通道，通过将网络注意力偏向对象的关键部分，有利于三角测量学习。

方法

以单目图像为输入的基线网络由主干网和三个后续模块组成，即前视图锚定生成、3d盒的提出和细化。三段流水线通过选择置信锚来逐步减少搜索空间，这大大降低了计算复杂度。
提出了一种利用立体信息进行精确三维目标检测的新网络。我们建立了一个坚实的基线单目检测器，灵活地扩展到立体声结合提出的TLNET。其核心思想是在立体图像中利用三维锚构造投影之间的几何对应关系，从而使网络学会在前向过程中对目标物体进行三角化。文中还介绍了一种有效的信道重加权方法来增强信息特征，削弱噪声信号。所有这些都集成到我们的基线检测器中，并实现最先进的性能。
在这里插入图片描述