51-16 FusionAD 用于自动驾驶预测与规划任务的多模态融合论文精读

深圳季连AIgraphX

已于 2024-01-25 14:01:34 修改

阅读量1.2k

点赞数 22

分类专栏： AutoGPT 智驾大模型文章标签：自动驾驶智慧城市 transformer gpt-3 迁移学习人工智能

于 2024-01-23 13:20:00 首次发布

本文链接：https://blog.csdn.net/weixin_45035094/article/details/135756728

版权

AutoGPT 智驾大模型专栏收录该内容

39 篇文章 11 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

今天要分享的是基于BEV的多模态、多任务、端到端自动驾驶模型FusionAD，其专注于自动驾驶预测和规划任务。这项工作首次发表于2023年8月2日，性能超越了2023 CVPR最佳论文UniAD模型。论文题目是FusionAD: Multi-modality Fusion for Prediction and Planning Tasks of Autonomous Driving，主要作者来自Udeer.ai、西湖大学和和菜鸟网络。

Abstract

构建多模态、多任务神经网络以实现准确和稳健的性能是自动驾驶感知任务的事实标准。然而，利用来自多个传感器的这些数据来联合优化预测和规划任务在很大程度上仍未得到探索。为此我们提出了 FusionAD，这是第一个融合来自两个最关键传感器（相机和 LiDAR）信息的统一框架，超越了感知任务。具体来说，我们首先构建了一个基于transformer的多模态网络，以有效地产生基于融合的特征。与基于相机的端到端方法UniAD相比，我们建立了一个旨在融合模态感知预测和状态感知规划的模块。它利用了多模态特征，在这里称为 FMSPnP。我们在常用的基准nuScenes数据集进行了广泛的实验，FusionAD在检测和跟踪等感知任务上有最先进的性能。它平均超过基线15%，占用预测精度提高10%，ADE评分的预测误差从0.708降低到0.389，并将碰撞率从0.31%降低到仅0.12%。

Introduction

在过去的几年里，深度学习一直在加速自动驾驶 (Autonomous Driving，AD) 的发展。对于自动驾驶，AD算法通常将相机和激光雷达信号作为感知输入，然后直接输出控制命令。AD任务通常分为感知、预测和规划。在传统的范式中，AD中的每个学习模块分别使用自己的主干并独立执行学习任务。此外，预测和规划等下游任务通常依赖于感知结果的向量化表示ÿ

了解本专栏

超级会员免费看

深圳季连AIgraphX

关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
51-16 FusionAD 用于自动驾驶预测与规划任务的多模态融合论文精读

FusionAD，基于BEV的多模态、多任务、端到端自动驾驶模型，专注于自动驾驶预测和规划任务，性能超越2023 CVPR最佳论文UniAD模型。
复制链接

扫一扫