自动驾驶
文章平均质量分 82
硅谷秋水
计算机视觉、图像视频处理、机器学习(深度学习)、自动驾驶、大模型和具身智体。
展开
-
BEVWorld:通过统一 BEV 潜空间实现自动驾驶的多模态世界模型
24年7月来自百度的论文“BEVWorld: A Multimodal World Model for Autonomous Driving via Unified BEV Latent Space”。原创 2024-07-23 00:31:24 · 1024 阅读 · 0 评论 -
持续学习、适应和改进:自动驾驶的dual-process方法
24年5月来自浙江大学、上海AI实验室和华东师范大学的论文“Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving”。原创 2024-07-22 13:54:48 · 756 阅读 · 0 评论 -
Text-to-Drive: 通过大语言模型实现多样化驾驶行为合成
24年6月来自UMass Amherst,、MIT CSAIL和MIT LIDS的论文“Text-to-Drive: Diverse Driving Behavior Synthesis via Large Language Models”。原创 2024-07-22 13:08:18 · 1009 阅读 · 0 评论 -
VisionTrap:基于文本描述的视觉增强轨迹预测
24年7月来自朝鲜大学、德州奥斯丁分校、普渡大学和现代汽车公司的论文“VisionTrap: Vision-Augmented Trajectory Prediction Guided by Textual Descriptions”。原创 2024-07-19 11:36:07 · 807 阅读 · 0 评论 -
像人类一样开车:大语言模型重新思考自动驾驶
23年7月份来自上海AI实验室和华东师范的大语言模型自动驾驶论文“Drive Like a Human: Rethinking Autonomous Driving with Large Language Models“。原创 2024-07-19 00:43:31 · 421 阅读 · 0 评论 -
ADAPT: 动作-觉察的驾驶字幕Transformer
23年2月份来自中科院自动化所和国内多所高校的一篇自动驾驶论文“ADAPT: Action-aware Driving Caption Transformer“,。最近Wayve公布的开环驾驶模型LinGO-1,思路有些类似。原创 2024-07-18 02:12:10 · 372 阅读 · 0 评论 -
MTD-GPT: 一个在无信号的交叉路口执行自动驾驶的多任务决策GPT模型
23年7月份来自同济大学和清华大学的工作的论文“MTD-GPT: A Multi-Task Decision-Making GPT Model for Autonomous Driving at Unsignalized Intersections“。该方法是利用了GPT的思路,训练一个token化的NLP模型。原创 2024-07-18 02:06:37 · 944 阅读 · 0 评论 -
DriveDreamer: 走向真实世界驱动的自动驾驶世界模型
23年9月来自一家创业公司GigaAI和清华大学的论文“DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving”,。主要的特点是扩散模型的引入,让世界模型中的环境表征更强。原创 2024-07-17 01:55:59 · 588 阅读 · 0 评论 -
Drive as You Speak: 在自动驾驶车中实现与大语言模型的类人交互
23年9月份来自美国普渡大学和维吉尼亚大学,以及深圳的儿科医学AI实验室的论文“Drive as You Speak: Enabling Human-Like Interaction with Large Language Models in Autonomous Vehicles“。原创 2024-07-17 01:55:08 · 679 阅读 · 0 评论 -
自动驾驶的语言提示
这篇23年9月份来自北理工、澳门大学、旷视科技和北京AI研究院的论文“Language Prompt for Autonomous Driving“。该文采用大模型chatGPT中采取的语言提示方法,去完成一个自动驾驶的轨迹预测任务。其中创建语言提示数据集时,需要语言大模型。原创 2024-07-16 00:39:20 · 463 阅读 · 0 评论 -
HiLM-D: 为了自动驾驶达到在多模态大语言模型中的高分辨率场景理解
23年9月来自香港科技大学和人华为诺亚实验室的论文“HiLM-D: Towards High-Resolution Understanding in Multimodal Large Language Models for Autonomous Driving“。原创 2024-07-16 00:38:26 · 433 阅读 · 0 评论 -
能用文字讲述发生了什么吗? 为了自动驾驶将预训练语言编码器集成到轨迹预测的模型中
23年9月份来自博世AI中心(德国和以色列两地)和德国Tubingen大学的论文“Can you text what is happening?原创 2024-07-15 00:16:43 · 387 阅读 · 0 评论 -
自动驾驶通过2D视觉语言蒸馏的无监督3D感知方法
23年9月来自谷歌waymo的论文“Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving“。原创 2024-07-15 00:16:02 · 839 阅读 · 0 评论 -
Talk2BEV: 自动驾驶中语言增强的BEV地图
10月3号来自印度IIIT、加拿大UBC、爱萨尼亚的U Tartu、美国TensorTour公司和MIT的论文“Talk2BEV: Language-enhanced Bird’s-eye View Maps for Autonomous Driving“。原创 2024-07-13 02:16:25 · 666 阅读 · 0 评论 -
Wayve的自动驾驶生成式世界模型:GAIA-1
23年9月底Waye在arXiv上上传了其GAIA-1模型的技术论文“GAIA-1: A Generative World Model for Autonomous Driving“。原创 2024-07-12 03:13:25 · 1030 阅读 · 0 评论 -
用LLMs驾驶: 融合目标级向量模态实现可解释自动驾驶
来自英国创业公司Wayve23年10月的自动驾驶论文“Driving with LLMs: Fusing Object-Level Vector Modality for Explainable Autonomous Driving“。原创 2024-07-12 03:12:32 · 581 阅读 · 0 评论 -
DRIVEGPT4: 通过大语言模型实现可解释的端到端自动驾驶
23年10月来自香港大学、浙江大学、华为和悉尼大学的论文“DRIVEGPT4: INTERPRETABLE END-TO-END AUTONOMOUS DRIVING VIA LARGE LANGUAGE MODEL“。原创 2024-07-10 00:28:56 · 989 阅读 · 0 评论 -
LanguageMPC: 自动驾驶中大语言模型作为决策器
23年10月来自国内清华大学、香港大学和加州伯克利分校的论文“LanguageMPC: Large Language Models As Decision Makers For Autonomous Driving“。原创 2024-07-10 00:27:54 · 456 阅读 · 0 评论 -
LINGO-1: 在自动驾驶中探索自然语言的作用
Wayve公司的自动驾驶模型 “LINGO-1: Exploring Natural Language for Autonomous Driving“。原创 2024-07-05 00:03:50 · 506 阅读 · 0 评论 -
GPT-DRIVER: 采用GPT学习驾驶
23年10月来自美国USC和国内清华大学的论文“GPT-Driver: Learning to Drive with GPT“。原创 2024-07-05 00:02:38 · 764 阅读 · 0 评论 -
接收、推理和反应:自主车辆中按大语言模型说的进行自动驾驶
23年10月来自普度大学、UIUC和Virginia大学的论文“Receive, Reason, and React: Drive as You Say with Large Language Models in Autonomous Vehicles“。原创 2024-06-27 11:05:29 · 599 阅读 · 0 评论 -
TrafficBots:实现自动驾驶仿真和运动预测的世界模型
23年9月来自瑞士ETH、德国MPI和比利时鲁文大学的论文“TrafficBots: Towards World Models for Autonomous Driving Simulation and Motion Prediction“。原创 2024-06-19 00:04:10 · 416 阅读 · 0 评论 -
Drive Anywhere: 带多模态基础模型的可泛化端到端自动驾驶
23年10月来自MIT、上海交大和TRI(Toyota)的论文“Drive Anywhere: Generalizable End-to-end Autonomous Driving with Multi-modal Foundation Models“。原创 2024-06-17 00:25:10 · 429 阅读 · 0 评论 -
开发世界模型做自动驾驶异常检测的潜力
23年8月来自德国FZI研究中心和卡尔斯鲁厄大学的论文"Exploring the Potential of World Models for Anomaly Detection in Autonomous Driving"。原创 2024-06-17 00:23:48 · 762 阅读 · 0 评论 -
从大语言模型蒸馏域知识:一个自动驾驶域的经验研究
23年7月来自英国高校的论文“Domain Knowledge Distillation from Large Language Model: An Empirical Study in the Autonomous Driving Domain“。原创 2024-06-17 00:22:57 · 862 阅读 · 0 评论 -
采用世界模型的自动驾驶多视角预测和规划
23年11月来自中科院自动化所和香港AI机器人研究中心的论文“Driving into the Future: Multiview Visual Forecasting and Planning with World Model for Autonomous Driving“。原创 2024-06-17 00:22:15 · 487 阅读 · 0 评论 -
Dolphins: 自动驾驶的多模态语言模型
23年12月来自Nvidia公司、Wisconsin-Madison分校,Michigan大学和斯坦福大学的论文“Dolphins: Multimodal Language Model For Driving“。原创 2024-06-15 14:09:28 · 694 阅读 · 1 评论 -
LaMPilot: 带语言模型程序的自动驾驶中一个开放基准数据集
23年12月来自普渡大学、UIUC、Virginia大学多家高校及北美丰田研究中心的论文“LaMPilot: An Open Benchmark Dataset for Autonomous Driving with Language Model Programs“。原创 2024-06-15 14:08:18 · 782 阅读 · 0 评论 -
Reason2Drive: 自动驾驶面向基于链和可解释的推理
23年12月来自复旦大学和华为诺亚实验室的论文“Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving“。原创 2024-06-15 14:07:22 · 844 阅读 · 0 评论 -
Surrealdriver: 基于大语言模型设计城市环境的生成式驾驶智体仿真框架
23年9月来自清华大学的论文“Surrealdriver: Designing generative driver agent simulation framework in urban contexts based on large language model“。原创 2024-06-15 00:19:34 · 508 阅读 · 0 评论 -
DiLu: 一个知识驱动的LLM自动驾驶方法
23年9月来自上海AI实验室、华东师大和香港中文大学的论文“DiLu: A Knowledge-Driven Approach To Autonomous Driving With Large Language Models“。原创 2024-06-15 00:18:53 · 623 阅读 · 0 评论 -
通过离散扩散学习自动驾驶中的无监督世界模型
23年11月来自Waabi创业公司的论文"Learning Unsupervised World Models For Autonomous Driving Via Discrete Diffusion"。原创 2024-06-14 00:47:05 · 654 阅读 · 0 评论 -
RoBoGEN: 生成式仿真为自动机器人学习释放无限数据
23年11月来自CMU、清华、MIT和麻省大学的论文“RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation“。原创 2024-06-13 14:47:40 · 941 阅读 · 0 评论 -
ADriver-I: 自动驾驶的一个通用世界模型
23年11月来自旷视科技等的论文“ADriver-I: A General World Model for Autonomous Driving“。原创 2024-06-13 14:45:45 · 605 阅读 · 0 评论 -
一个自动驾驶的语言智体
23年11月来自Nvidia、加州USC和斯坦福的论文"A Language Agent for Autonomous Driving“。原创 2024-06-13 13:27:11 · 599 阅读 · 0 评论 -
MUVO:自动驾驶带几何表征的多模态生成式世界模型
23年11月来自KIT的论文“MUVO: A Multimodal Generative World Model for Autonomous Driving with Geometric Representations“。原创 2024-06-13 08:26:34 · 208 阅读 · 0 评论 -
NeuRAD:自动驾驶的神经渲染
23年11月来自Zenseact,Chalmers科技大学,Linkoping大学和Lund大学的论文"NeuRAD: Neural Rendering for Autonomous Driving"。原创 2024-06-13 00:09:07 · 653 阅读 · 0 评论 -
自动驾驶中GPT-4增强多模态落地:利用带大模型的跨模态注意机制
23年12月来自澳门大学、成都电子科大(中国)、重庆大学和吉林大学的论文"GPT-4 Enhanced Multimodal Grounding For Autonomous Driving: Leveraging Cross-Modal Attention With Large Language Models"。原创 2024-06-13 00:04:15 · 462 阅读 · 0 评论 -
从安全角度看用大语言模型实现的自动驾驶
23年12月来自美国西北大学、耶鲁大学和英国利物浦大学的论文“Empowering Autonomous Driving with Large Language Models: A Safety Perspective“。原创 2024-06-13 00:03:45 · 1053 阅读 · 0 评论 -
自动驾驶中大语言模型决策方法的评估
23年12月来自日本Turing电动汽车公司的论文“Evaluation of Large Language Models for Decision Making in Autonomous Driving“。原创 2024-06-12 15:46:29 · 642 阅读 · 0 评论