经典文献阅读之--DEviLOG(使用合成数据和真实世界数据的数据驱动占用网格映射基于Transformer的BEV方案量产方案)

0. 简介

在自动驾驶汽车(AV)的感知任务中,数据驱动的方法往往优于传统方法。这促使我们开发了一种基于数据的方法来从激光雷达测量中计算占用网格地图(OGM)。我们的方法扩展了之前的工作,使得估计的环境表示现在包含一个额外的层,用于标记被动态物体占据的单元格。早期的解决方案只能区分自由和占用的单元格。障碍物是否可以移动的信息对于规划AV的行为非常重要。《Data-Driven Occupancy Grid Mapping using Synthetic and Real-World Data*》提出了两种生成训练数据的方法。一种方法扩展了我们以前关于使用合成训练数据的工作,以便生成具有上述三种单元状态的OGM。另一种方法使用nuScenes[1]数据集的手动注释创建训练数据。我们在未见过的真实世界数据上对两个模型的性能进行定量分析。相关代码可以在Github中找到。

1. 主要贡献

  1. 本研究进一步发展了我们先前的方法,该方法能够预测具有“空闲”、“静态占用”和“动态占用”三种单元状态的占据网格图(OGMs)。
  2. 我们在真实世界的nuScenes数据集[1]上进行了定量性能分析。本文比较了在合成数据上训练的模型与基于数据集手工注解生成标签训练的模型的性能。
  3. 我们通过将这两种方法应用于我们的研究车辆之一,检验了它们对新传感器配置的适应能力。因此,我们提出了一种方法学,通过使用真实世界的数据集来发现仿真中的盲点,并提高在合成数据上训练得到的模型对真实世界测量数据的领域适应性。
  4. 通过开源我们的基准测试和评估算法,我们鼓励其他研究者与我们的方法进行比较,以促进该领域的发展。

2. 数据驱动的占据网格图绘制

我们将占据网格图绘制视为一个监督学习问题,并介绍了我们的神经网络架构以及生成训练数据的两种方法。一种方法使用仿真生成的合成数据,另一种方法使用手工注解数据集生成的标签。

2.1 网络架构

我们的网络架构基于PointPillars[28],该架构在激光雷达点云的目标检测中表现良好。我们使用相同的特征编码层和适配版本的CNN主干网络。预测头部被我们的证据预测头[6]替换,该预测头在本工作中扩展到三层,以包含可能的单元状态A∈ΘA∈Θ的证据。该模型使用Sensoy等人[22]提出的期望均方误差损失函数进行训练。

这个信念质量 bA∈[0,1]bA​∈[0,1] 被用于我们网络预测的证据占据栅格图(OGM)中。

<br/>

2.2 来自模拟的合成训练数据

正如文献[6]中所述,我们使用VTD [26]在城市3D环境中创建模拟场景,包括静态障碍物(如交通灯、长凳、电线杆)以及动态对象(如行人、自行车、车辆)从大型车辆类型目录中选取。模拟的自我车辆(ego vehicle)在大小和类型上与用于记录测试数据集的车辆相似,并使用车辆动力学模型来实现,例如,在加速或转弯时的真实滚动和俯仰角。它配备了一个虚拟的激光雷达传感器,其位置与真实车辆相似。激光束通过在900个水平方向上的32个垂直层上使用光线投射来模拟,类似于真实传感器。第二个虚拟的激光雷达传感器具有相同的位置和视场,但使用3000个而不是32个垂直层来创建更密集的激光雷达点云。这些合成点云包含了关于反射源材料的信息,这被解释为对包含反射点及其周围单元格在标签OGM中占据状态的证据。与我们之前的方法[6]不同,只有在合法可行驶材料(如沥青、道路标记)上的反射贡献了一个信念质量

点击经典文献阅读之--DEviLOG(使用合成数据和真实世界数据的数据驱动占用网格映射基于Transformer的BEV方案量产方案) ——古月居可查看全文

  • 13
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值