这以后阅读的论文逐渐靠近自动驾驶实用领域,本文要讲的是Bird's-Eye-View,BEV开山之作,来自Nvidia的LSS论文。
LSS核心动机:2D-->3D,构建BEV空间。LSS核心结构首先是利用Lift模块进行深度分布学习,将二维图像特征生成3D特征,其次利用Splat模块做特征映射,把3D特征拍扁得到BEV特征图,最后利用Shoot模块在BEV特征图上进行相关任务操作。
论文和代码地址
论文名称:Lift, Splat, Shoot Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D
论文地址:https:/