基本介绍
3DOP这篇文章是当下使用双目相机进行3D bounding-box效果做好的方法,其是Fast RCNN方法在3D领域之内的拓展。由于原论文发表于NIPS15,出于Fast RCNN的效果并没有Faster RCNN和基于回归的方法好,且远远达不到实时性,因此其处理一张图片的时间达到了4.0s。
以下文章的介绍将主要依据资料更为完成的PAMI17来分析。
总体结构
如下则是该方法的总体流程:
其流程基本仿照Fast RCNN来进行实现,相对Xiaozhi Chen后续发表的MV3D而言,其就够较为简单。
后来,作者同样考虑到如果利用RGB-D图像是否会有更好的效果,于是设计了下面的这种流程:
关于训练以及实验部分的内容,待看完后再进行分析。