基本信息
- 题目:Drive on Language: Unlocking the future where autonomous driving meets the unlimited potential of language.
- 时间:2023.8
- 机构:OpenDriveLab,图宾根大学
- 链接直达:github
- 关键词:自动驾驶,语言模型,推理能力
- 概括:DriveLM 是一个自动驾驶数据集,旨在连接大型语言模型和自动驾驶系统,从而提高语言模型在决策和可解释性规划中的推理能力。
- 是否开源:未开源pipeline。数据集放出。
理解
- DriveLM 数据集是通过选择涉及自我车辆运动状态变化的关键帧并在周围图像中选择关键物体来获得的。
- 关键帧选择是根据涉及自我车辆运动状态变化的帧来完成的,例如车道变更、突然停下和停下后启动。
- 关键对象的选择是基于以下标准进行的:这些物体应该能够影响自我车辆的动作,例如交通信号、过马路的行人以及其他朝着自我车辆方向行驶的车辆
- 问题和答案注释是通过基于所选关键对象自动生成有关单个或多个对象的感知、预测和规划的问题来完成的。
- 数据集包括以一种名为思维图 (GoT) 的图形式结构连接的 QA 对,以 QA 对作为节点,对象的关系作为边缘,便于感知、预测和规划 (P3)
精读
暂无