盘一盘世界模型与自动驾驶场景生成

作者 | 冰锐 编辑 | 自动驾驶之心

原文链接:https://zhuanlan.zhihu.com/p/686277501

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心世界模型技术交流群

本文只做学术分享,如有侵权,联系删文

框架

mmagic:https://github.com/open-mmlab/mmagic

综述

World Models for Autonomous Driving: An Initial Survey

21d58527b765f1f66bcc6140d7d9d40a.png 02121ab7f42dccab406a95650ac553f9.png

The JEPA model aims to construct mapping relationships between different inputs in the encoding space by minimizing input information and prediction errors.

56628c9df5a404445cf8424004314b89.png

Towards Knowledge-driven Autonomous Driving

91effc5e653d50cd5dac1218432b51af.png e88796544f3c1145120872cd6aff7ca7.png

Embodied AI is a facet of intelligence emphasizing the direct interaction between an intelligent system and its environment, involving perception, understanding, and action.

da7d6dbb4bc02945d1f2e49bdc3d80aa.png

扩散模型

Diffusion model

扩散模型 - Diffusion Model【李宏毅2023】_哔哩哔哩_bilibili

Diffusion扩散模型大白话讲解,看完还不懂?不可能!

c3b3ae7f824402707951389e3468a083.png

多模态预训练CLIP

Diffusion论文:Denoising Diffusion Probabilistic Models

StableDiffusion论文:High-Resolution Image Synthesis with Latent Diffusion Models

Diffusers

stable-diffusion-v1-5权重地址:runwayml/stable-diffusion-v1-5 at main

pytorch手写Diffusion Model:The Annotated Diffusion Model

Stable Diffusion with Diffusers

手写扩散模型-diffuers介绍_哔哩哔哩_bilibili

世界模型

GAIA-1(2023.9.29)

5362a82267af3c3cd26253fd8147ebb1.png

MAGICDRIVE(2024.1.26)

论文地址:MAGICDRIVE: STREET VIEW GENERATION WITHDIVERSE 3D GEOMETRY CONTROL

github:https://github.com/cure-lab/MagicDrive

36b3a0d513cc4bed05ea7f3c37435eb3.png

Drive WM(2023.11.29)

cd2e81931b9f2c296627b89d4fd7491b.jpeg

https://github.com/BraveGroup/Drive-WM?tab=readme-ov-file

MUVO(2023.11.23)

多模态生成

1e656686390de76fdc13a5a92704074a.png

DriveDreamer(2023.11.27)

https://github.com/JeffWang987/DriveDreamer

https://drivedreamer.github.io/

c77e77fc42bac6d1b0bf4520d3f28e6a.png

DriveDreamer-2: LLM-Enhanced World Models for Diverse Driving Video Generation(2024.3.11)

多视角视频生成

ced80b210158552a6ef234e44f8a82cb.png

WorldDreamer

https://world-dreamer.github.io/

735de56d8f91e0c37d4de5ec0e9af1b1.png

OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving

Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

Driving with LLMs

DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models(2024.2.25)

DriveVLM集成了场景描述、场景分析和分层规划的思维链(CoT)模块

VLM计算量大,提出DriveVLM Dual,将DriveVLM的优势与传统自动驾驶流水线协同混合

据说可以部署在orin芯片上,但猜测只是在orin上跑通,还没有大规模部署到车上

c92d40a57ef402495352198f499bacf8.png

DriveVLM识别了一个倒塌的树木,并给出了稍微向右偏移的驾驶决策

4a9acad1b0877214ecbf84dba48e473d.png f2712a8ac64436998438b194ba014289.png ebf7023b0d49cffbbea75f5e68bfa886.jpeg

Driving with LLMs: Fusing Object-Level Vector Modality for Explainable Autonomous Driving

论文地址:Driving with LLMs: Fusing Object-Level Vector Modality for Explainable Autonomous Driving

github:https://github.com/wayveai/Driving-with-LLMs

8186b12ee56e6afb078ef39c9fed541f.png

ADriver-I: A General World Model for Autonomous Driving

1d9b9c306d9a1f48a501609935cc3dcb.png

GAN(图生图)

CYCLEGAN

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

mmgeneration:https://github.com/open-mmlab/mmgeneration?tab=readme-ov-file

Lidar GAN

GAN-Based LiDAR Translation between Sunny and Adverse Weather for Autonomous Driving and Driving Simulation

① 2025中国国际新能源技术展会

自动驾驶之心联合主办中国国际新能源汽车技术、零部件及服务展会。展会将于2025年2月21日至24日在北京新国展二期举行,展览面积达到2万平方米,预计吸引来自世界各地的400多家参展商和2万名专业观众。作为新能源汽车领域的专业展,它将全面展示新能源汽车行业的最新成果和发展趋势,同期围绕个各关键板块举办论坛,欢迎报名参加。

f00bd1f3a70352ba1e9d8c42896d6167.jpeg

② 国内首个自动驾驶学习社区

『自动驾驶之心知识星球』近4000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知端到端自动驾驶世界模型仿真闭环2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型,更有行业动态和岗位发布!欢迎扫描加入

d05d19dfe7f88628ef6bafd1f3811857.png

 ③全网独家视频课程

端到端自动驾驶、仿真测试、自动驾驶C++、BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、CUDA与TensorRT模型部署大模型与自动驾驶NeRF语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

12096f60c8e6507516a845ffd1fe7940.png

网页端官网:www.zdjszx.com

④【自动驾驶之心】全平台矩阵

2ec05287c5c8496bd5f4f70913ddd765.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值