CVPR2024 | 优于所有方法!HIMap:端到端矢量化HD地图构建

编辑 | 自动驾驶Daily

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心高精地图技术交流群

本文只做学术分享,如有侵权,联系删文

矢量化高清(HD)地图构建需要预测地图元素的类别和点坐标(例如道路边界、车道分隔带、人行横道等)。现有技术的方法主要基于点级表示学习,用于回归精确的点坐标。然而,这种pipeline在获得element-level信息和处理element-level故障方面具有局限性,例如错误的element 形状或element之间的纠缠。为了解决上述问题,本文提出了一个简单而有效的HybrId框架,命名为HIMap,以充分学习和交互点级和element级信息。

具体来说,引入了一种称为HIQuery的混合表示来表示所有地图元素,并提出了一种点element交互器来交互式地提取元素的混合信息,如点位置和element形状,并将其编码到HIQuery中。此外,还提出了点-element一致性约束,以增强点级和element级信息之间的一致性。最后,集成HIQuery的输出点元素可以直接转换为地图元素的类、点坐标和掩码。在nuScenes和Argoverse2数据集上进行了广泛的实验,结果显示始终优于以前的方法。值得注意的是,在nuScenes数据集上方法实现了77.8mAP ,显著优于以前的SOTA至少8.3 mAP!

论文名称:HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map Construction

论文链接:https://arxiv.org/pdf/2403.08639.pdf

HIMap首先引入一种称为HIQuery的混合表示来表示地图中的所有地图元素。它是一组可学习的参数,可以通过与BEV特征交互来迭代更新和细化。然后,设计了一个多层混合解码器,将地图元素的混合信息(如点位置、元素形状)编码到HIQuery中,并进行点元素交互,见图2。混合解码器的每一层包括点元素交互器、自关注和FFN。在点元交互器内部,执行了一个相互交互机制,以实现点级和元素级信息的交换,避免单级信息的学习偏差。最终,集成HIQuery的输出点元素可以直接转换为元素的点坐标、类和掩码。此外,还提出了点-元素一致性约束,以加强点级和元素级信息之间的一致性。

0bacf85151999f81555ec00175431a25.png

HIMap框架一览

HIMap的总体pipeline如图3(a)所示。输入 HIMap与各种机载传感器数据兼容,例如来自多视图相机的RGB图像、来自激光雷达的点云或多模态数据。这里我们以多视图RGB图像为例来说明HIMap。

9c109df155e078726164ec25e030f727.png

BEV特征提取器:使用BEV特征提取器从多视图RGB图像中提取BEV特征。它包括从每个透视图中提取多尺度2D特征的主干,将多尺度特征细化并融合为单尺度特征的FPN,以及将2D特征映射为BEV特征的2D到BEV特征转换模块。

HIQuery:为了充分学习地图元素的点级和元素级信息,引入HIQuery来表示地图中的所有元素!

混合解码器:混合解码器通过将HIQuery Qh与BEV特征X迭代交互来产生集成的HIQuery。

点元素交互器的目标是交互式地提取地图元素的点级和元素级信息并将其编码到HIQuery中。两个层次的信息相互作用的动机来自于它们的互补性。点级信息包含局部位置知识,而元素级信息提供整体形状和语义知识。因此,该交互使得能够对地图元素的局部信息和整体信息进行相互细化。

考虑到点级表示和元素级表示之间的原始差异,它们分别关注局部信息和整体信息,两级表示的学习也可能相互干扰。这将增加信息交互的难度,降低信息交互的有效性。因此,引入了点元素一致性约束,以增强每个点级别和元素级别信息之间的一致性,元素的可分辨性也可以得到加强!

实验结果对比

论文在NuScenes Dataset和Argoverse2 Dataset上进行了实验!

在nuScenes val-set上的SOTA模型进行比较:

356f78aef68ea2444ce6a30cf2fb5fb7.png

和Argoverse2 val set上的SOTA模型比较:

5770d032684c197ce0d4ac0a042a25b5.png

与nuScenes验证集多模态数据下SOTA模型比较:

285e989167682520dde4d94d9ec9bb2a.png f719c5d1f7de69d9ebabcbd9670c5f38.png

更多消融实验:

9fc2c096293e93553389dcc21cb3a8e7.png 1ae1f4e699b997aacd9ec478d4c269e5.png 2252314c772c17c93ef2b09ecb54fa12.png

投稿作者为『自动驾驶之心知识星球』特邀嘉宾,欢迎加入交流!

① 全网独家视频课程

BEV感知、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、cuda与TensorRT模型部署大模型与自动驾驶Nerf语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

fb0201dded08957e038a2b514b248f5f.png

网页端官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业,近2700人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型、端到端等,更有行业动态和岗位发布!欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频

c3fc4c1e26282e3a5b76140992332758.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦2D/3D目标检测、语义分割、车道线检测、目标跟踪、BEV感知、多模态感知、Occupancy、多传感器融合、transformer、大模型、在线地图、点云处理、端到端自动驾驶、SLAM与高精地图、深度估计、轨迹预测、NeRF、Gaussian Splatting、规划控制、模型部署落地、cuda加速、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向。扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

172c088079370da8e22a387117113e3f.jpeg

④【自动驾驶之心】平台矩阵,欢迎联系我们!

ddc94c055ab467460275c3c25ae7501b.jpeg

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值