世界模型(World Models)才是自动驾驶终极目标吗?

自2023年特斯拉、Wayve相继发布World Models,世界模型便凭借强大的环境理解能力,成为自动驾驶领域前沿热点,研究主要集中于场景生成和预测规控等方面,由此涌现出一批基于世界模型的端到端、2D/3D生成方法,从CVPR’24收录的Drive-WM,到ECCV‘’24接收的DriveDreamer等,而在今年7月,百度也最新开源了用于自动驾驶的多模态世界模型BEVWorld!

77afc5e7fedb1f8dd029de5a0d21d328.png

为了帮助大家掌握世界模型的创新应用,研梦非凡于8月13日晚(周二),邀请了来自中科院、从事自动驾驶算法研究的周导师,为大家独家详解《BEVWorld:自动驾驶多模态世界模型》(AI前沿直播课NO.60),从世界模型的概念、自动驾驶面临的挑战,再到代表性工作GAIA-1、ADriver-I等,重点讲解BEVWorld的算法框架、组成部分以及实验分析,1节课速通世界模型!

👇🏻扫描二维码找助教0元预约直播课!

e6307170b77fbbd59640dbd53ae1bab7.png

凡预约即可免费领取20篇自动驾驶世界模型前沿论文(赠idea清单)+200余篇BEV/OCC/端到端及顶会论文+文末还有算力等科研福利!

682a3c028c0103b3308df8acb8da71b9.gif

直播课内容概览

01 论文摘要

  1. 世界模型概念

  2. BEVWorld简介

  3. BEVWorld组成

  • 多模态标记器

  • 潜在BEV序列扩散模型

02 研究背景

  1. 自动驾驶面临的挑战

  • 训练需要大量精确注释数据,考验资源和时间

  • 自动驾驶系统除了感知环境,还需全面了解后进行决策

  1. 解决挑战的现状

  • 关键:构建一个用于自动驾驶的多模态世界模型

  • 现状:大多数方法都基于单一模态,无法适应当前的多传感器、多模态自动驾驶系统

  1. 解决挑战的方法

  • BEVWorld:多模态世界模型

  • 多模态标记器的核心功能

  • 潜在BEV序列扩散网络的核心功能

  1. BEVWorld创新点

  • 引入了一种新颖的多模态标记器,将视觉语义和3D几何集成到统一的BEV表示中

  • 设计了一个基于潜在扩散的世界模型,可以同步生成未来的多视图图像和点云

03 相关工作

  1. 世界模型

  • GAIA-1:基于生成模型的自动驾驶世界模型

  • ADriver-I:用于自动驾驶的通用世界模型

  • Drive-WM(CVPR'24):首个与端到端规划模型兼容的驾驶世界模型

  1. 视频扩散模型

  • LVDM

  • GenAD

  • VDT、Sora

    👇🏻扫描二维码找助教0元预约直播课!

    a9bebacb01becb24ac59a7e06c8ec0ea.png

04 算法框架

  1. BEVWorld算法框架

  2. BEV编码器的详细结构

  3. 多模态标记器

  • 多视角图像渲染细节

  • 激光雷达渲染细节

  1. 潜在BEV序列扩散模型

  • 时空注意力模块架构

05 实验分析

  1. 数据集和测试环境介绍

  • NuScenes

  • Carla

  1. 多模态标记器的消融实验

  2. 潜在BEV序列扩散的消融实验

  3. 定性分析结果

06 总结和展望

导师简介

周导师

中科院卫星研制及应用工程师,同时,参与某汽车企业自动驾驶部门合作,从事自动驾驶算法研究,发表过SCI等论文多篇,专利4篇。

直播福利

参加本次直播的同学都将获得1小时导师meeting的福利(助教+导师)原价2999,限时福利价9.9元!活动时间为8月13日到8月31日

ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松完成论文报告。

👇🏻扫描二维码找助教0元预约直播课!

f69092c7b2bbe691a75689b85eed87f5.png

凡预约即可免费领取20篇自动驾驶世界模型前沿论文(赠idea清单)+200余篇BEV/OCC/端到端及顶会论文+文末还有算力等科研福利!

研梦非凡科研论文指导

如果你的研究方向/方法/idea是属于CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向,如果你需要发CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等,都可以来研梦非凡,匹配合适的科研指导。

(下面是我们根据自动驾驶之心粉丝需求,整理的现有idea!)

自动驾驶方向现准备好的idea

f2c20eb3a17c55e59eeb74fa728f65b8.png

👇🏻扫码找助教了解更多/验证自己的idea是否可行

2793046163e486c20287f79b67e68d42.png

研梦非凡科研论文指导方案

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

b3746d842e77a289173ed9715bc7a036.jpegc2aca06d695798768867691a1c336315.jpeg

<<< 左右滑动见更多 >>>

👇🏻扫描二维码咨询助教两种指导方案

951f32ce2ff7a4e2d34ca14d8b929878.png

研梦非凡部分导师介绍

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~

68f6768b4e32015e5cc0f5c971c0c1d7.png5f2f6c426050c4138e1175719be7a9dc.png5b9c02b161565c7d5a1c5201770a1f42.pnga0209c5ca045a952d744f65ab74cbcd1.png

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

9da84975f4050e799387f35f74c4ca24.png

研梦非凡科研福利

🌟90分钟人工智能零基础入门课免费领

🌟7小时科研论文写作系列课免费领

🌟数十节前沿论文直播课程免费领

🌟50小时3080GPU算力免费领

🌟百篇8月论文资料大合集免费领

🌟报名本次直播课,9.9元即可享受原价2999元的1小时导师meeting(助教+导师)! 

👇🏻扫码领取以上6重粉丝专属科研福利!

e390c6f1e5d6d992f869f25c0fc665b5.png

15816744534bd9ca6e3242c90cf2f165.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值