Reason2Drive阅读笔记


基本信息

  • 题目:Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving
  • 时间:2023.12
  • 机构:School of Data Science, Fudan University / Huawei Noah’s Ark Lab
  • 作者:Ming Nie等
  • 链接直达:github/paper/
  • 方向:自动驾驶,大型视觉语言模型(VLM),知识驱动的自动驾驶,
  • 概括:一个数据集包含600K问答对,将自动驾驶过程分为感知、预测和推理三步分别进行问答,相当于一个链式的推理决策过程。
    图b是数据集的问答形式

理解

  1. 干了一件什么事:
    提出了一个数据集,旨在促进解决自动驾驶过程中的推理可解释性。并提出了新的指标。
  2. 数据集怎么来的:
    在nuScenes , Waymo , ONCE 数据集基础之上。使用了人工+GPT-4。
  3. 数据集采集的pipeline(如图):
    用vision encoder和prior tokenizer来编码输入视频和感知先验。然后用Q-Former对齐,输入到GPT-4里,同时询问问题,得到回答。由vision decoder得到感知结果。
    PIPELINE

精读

暂无


参考文献

  1. https://github.com/fudan-zvg/Reason2Drive
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值