Monocular BEV Perception of Road Scenes via Front-to-Top View Projection
题目:通过前视至顶视图投影的单目道路场景鸟瞰感知
作者:Wenxi Liu; Qi Li; Weixiang Yang; Jiaxin Cai; Yuanlong Yu; Yuexin Ma; Shengfeng He; Jia Pan
源码: https://github.com/avishkarsaha/translating-imagesinto-maps
摘要
高精地图重建对于自动驾驶至关重要。基于激光雷达的方法由于昂贵的传感器和耗时的计算而受到限制。基于相机的方法通常需要分别执行道路分割和视图转换,这经常导致失真和内容缺失。为了推动技术的发展,我们提出了一个新颖的框架,仅使用前视单目图像重建由道路布局和车辆占用组成的局部地图在鸟瞰图中。我们提出了一个前视到顶视图投影(FTVP)模块,它考虑了视图间循环一致性的约束,并充分利用它们的相关性来加强视图转换和场景理解。此外,我们应用多尺度FTVP模块来传播低级特征的丰富空间信息,以减少预测对象位置的空间偏差。在公