文章目录
1. Bevfusion 结构介绍
1.1 结构概览
论文中给出了
Bevfusion
的架构图
,它的输入是多视角的相机
和点云
图,经过两个特定的head
,分别用于做检测任务
和分割任务
。
Bevfusion因为有两个模态的输入:多视角相机和点云,所以对应两个分支:相机分支和点云分支。
相机分支
:输入6个视角的图片后,提取特征,然后经VT
(View Transformer)转换之后得到相机的Bev特征
。激光雷达分支
:输入点云数据,经过Encoder编码得到体素化Lidar特征,然后沿z方向展平,得到Lidar Bev特征