Deep Fitting Degree Scoring Network for Monocular 3D Object Detection
一种用于单目三维目标检测的深度拟合度评分网络
这篇文章看下来,怎么说呢,emmmmm,我发现自己好像看错了,因为这是基于单目的3D目标检测,网络的输入只有二维图片,是的,你没看错,只有一张图片就能得出物体的3D bounding box,这好像不是我研究的方向呀⊙﹏⊙b汗~不过既然看了,就大致的总结一下吧。
个人的一些理解:
文章中,作者建议学习一种用于单目三维物体检测的深度拟合度评分网络,旨在最终对提案和对象之间的评分程度进行评分。与大多数使用严格约束来获得3D定位的单目框架不同,其方法通过测量投影的3D选框和对象之间的视觉拟合程度来实现高精度定位。首先使用基于锚的方法回归对象的尺寸和方向,以便可以构建合适的3D选框。作者提出了FQNet,它可以仅基于2D线索推断3D选框和对象之间的3D IoU。因此,在检测过程中,在3D空间中对大量候选框进行采样,并将这些3D bounding box单独投影到2D图像上。通过简单地以FQNet的输出3D IoU得分的形式探索提案和对象之间的空间重叠,可以挑选出最佳候选者。
说白了,就是先通过2D object detection得出2D bounding box,然后根据2D bounding box 通过一个回归模块,回归出尺寸和方向。再根据尺寸和方向,通过一个自研网络FQNet,得出位置信