![70413eea45814a480437b0432490c110.png](https://i-blog.csdnimg.cn/blog_migrate/f842b5635686662baad4d02a7ed15035.png)
这篇文章和前两篇有比较大的区别,主要原因是用到了视觉识别的结果,这里的frustum就是视椎体的意思。
0. 前言
论文链接
github链接
1. 介绍
主要讲了自己的动机,然后介绍了一下自己的网络,最后说了一下自己的网络哪里好,这里就介绍一下这个网络吧。
![9bacae238d8ffcba411cb9a6e2459753.png](https://i-blog.csdnimg.cn/blog_migrate/c8085caebcd31822e18dd22476a95735.jpeg)
首先从图片检测结果的Boundingbox拉出一个3D的视椎体(如图红色椎体所示)。
然后用两个Point-Net变体分别作object instance segmentation 以及 amodal 3D bounding box regression(这里amodal就当做这篇文章的专有名词好了),其中第二部分可以根据一部分点云计算出整个boundingbox。
2. 相关工作
主要介绍了用RGB-D(Depth)当前做3D Detection的现状,主要有以下几种:
- 基于前视图的方法:主要利用双目摄像头,缺点是 i