【DAY003】论文阅读-01

最新推荐文章于 2024-09-29 16:00:34 发布

镝ER

最新推荐文章于 2024-09-29 16:00:34 发布

阅读量440

点赞数 5

分类专栏：论文阅读文章标签：笔记

本文链接：https://blog.csdn.net/m0_51990638/article/details/142384232

版权

Hint-AD: Holistically Aligned Interpretability in End-to-End Autonomous Driving

https://arxiv.org/abs/2409.06702

摘要：之前对于端到端自动驾驶可解释的研究主要对控制的结果进行解释；Hint-AD整合了中间结果，对感知计划和预测建立了解释；开源了Nu-X数据集。

问题：现有的端到端自动驾驶的可解释性研究忽略了语言解码器和自动驾驶系统的感知预测规划之间的对应关系，导致语言任务和自动驾驶任务之间存在差异。
方法：一个混合模块的adapter，将AD模型的中间输出对齐到语言解码器；一个训练任务，将语言和AD中间输出对齐

模型结构：
在这里插入图片描述
从现有的AD架构中，提取BEV、感知、预测和规划信息作为token，通过attention处理后一同encode为固定长度的token序列，而后同text一同作为提示词输入MLLM中decode生成文本。

Holistic token mixer

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

镝ER

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

使用AIGC工具提升论文阅读效率

herosunly的博客

06-10

8万+

本文介绍使用AIGC工具提升论文阅读效率，希望对学习和使用AIGC的同学们有所帮助。文章目录 1. 前言 2. 科学方法提升阅读效率 3. 检验阅读成果

【论文阅读】Learning to Drive in a Day

weixin_41577426的博客

05-25

1949

论文下载官方Blog 论文翻译与解读:一天学会开车摘要一、介绍二、相关工作三、系统架构四、实验五、讨论摘要　　我们演示了深度强化学习在自动驾驶（autonomous driving）中的首次应用。通过随机初始化的参数，我们的模型能够使用一个单目图像作为输入，仅用少量的训练场景（training episodes）就能够学习车道跟踪（lane following）策略。我们设...

参与评论您还未登录，请先登录后发表或查看评论

LLaVA-Med 论文阅读笔记

qq_58400270的博客

12-03

1777

本文提出了一种经济有效的方法训练一个可以回答生物医学图像开放研究问题的视觉-语言对话助手。

day01--对抗样本学习-论文阅读

404_Not__Found

10-10

1471

昨天嗓子痛，晚上在实验室着实待不下去了，遂溜，今晚补更今天主要看论文EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES（解释和治理对抗样本）欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改...

论文精读--word2vec

m0_73202283的博客

02-20

2195

我们提出了两种新的模型架构，用于计算来自非常大的数据集的单词的连续向量表示。在单词相似度任务中测量这些表示的质量，并将结果与先前基于不同类型神经网络的最佳表现技术进行比较。我们观察到在更低的计算成本下，准确率有了很大的提高，即从16亿个单词数据集中学习高质量的单词向量只需要不到一天的时间。此外，我们展示了这些向量在我们的测试集上提供了最先进的性能，用于测量句法和语义单词相似度。生成词向量又快又好。

论文笔记: Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation

c2861024198的博客

09-02

836

论文泛读笔记

论文阅读【时空+大模型】ST-LLM（MDM2024）

micaudience的博客

07-11

1302

Spatial-Temporal Large Language Model for Traffic Prediction

CCS2019：Log2vec论文阅读

hxhabcd123的博客

10-21

4013

本文记录2019年CCS中的Log2vec论文的阅读笔记。

论文阅读：《An Online-Calibrated Time Series Based Model for Day-Ahead Natural Gas Demand Forecasting》

KI的博客

11-20

5168

基于在线校准时间序列的天然气需求预测模型。

C会区块链论文速读-TrustCom 2023（5/6）大语言模型和区块链如何结合？

软件工程小施同学的专栏

06-28

2204

我们的模型在七种类型的漏洞中取得了 82.63% 的平均准确率和 79.74% 的 F1 分数，这对于确保智能合约中的资金和逻辑安全非常重要。在合约漏洞的语义提取阶段，TSCSG 利用智能合约数据传播链提取智能合约漏洞的语义特征，然后结合图特征得出最终检测结果。我们在 EtherScan 数据集上进行的大规模实证研究表明，TSCSG 在检测重入性和时间戳漏洞方面取得了令人满意的结果，优于 9 种最先进的漏洞检测方法。此外，我们的重要发现是，通过分析智能合约交易的特征，可以将其集合表示为一个超图网络。

Paper-a-Day:论文集，每天阅读

03-11

为了增加我对不同领域的了解以及阅读和综合论文的能力，我创建了这个存储库。每天我都会阅读并上传一篇论文（来自任何领域）。此存储库中的每个文件夹都是一个主要字段（例如Machine Learning），其中可能包含子...

论文研究 - 越南Nhue-Day流域农业食品加工手工业村中家庭支付污水处理意愿的影响因素

05-18

越南Nhue-Day流域的部分农户参与农业加工的研究结果表明，影响他们支付建造污水处理厂的意愿的主要因素是他们的教育程度，家庭数量未经处理的废水，更容易受到污染不利影响的幼儿的存在，家庭成员患病的经历，家庭...

AIGC学习笔记—minimind详解+训练+推理

m0_56569131的博客

09-27

282

H.264学习笔记

zfenggo的博客

09-26

833

H.264凭借其出色的压缩效率、灵活的编码方式以及高质量的视频表现，成为了现代视频技术的核心标准之一。它不仅减少了存储需求，还提高了流媒体和实时视频传输的可行性。对于从高清到超高清视频，H.264的编码能力仍然广泛适用。H.264的帧结构设计（I帧、P帧和B帧）极大地提高了视频编码的压缩效率。I帧保存完整的图像信息，P帧通过参考之前的帧减少冗余数据，而B帧则通过双向参考提供进一步的压缩优势。这种帧间的协同工作大幅降低了带宽需求和存储成本，同时保持了视频的高质量。NALU头。

江科大笔记—LED闪烁& LED流水灯& 蜂鸣器

m0_62005595的博客

09-28

464

LED闪烁& LED流水灯& 蜂鸣器

React学习笔记（2.0）

mez_Blog的博客

09-26

474

本质：和普通JS变量不同的是，状态变量一旦发生变化组件的视图UI也会跟着发生变化（数据驱动视图），可以类比与vue中的响应式。这里的e就是一个类似原生的事件e，并不是真正的原生事件e,如果要使用原生事件e，需要使用 e.nativeEvent。在React中，一个组件就是首字母大写的函数，内部存放了组件的逻辑和视图UI，渲染组件只需要把组件当成标签书写即可。概念：一个组件就是用户界面的一部分，他可以有自己的逻辑和外观，组件之间可以相互嵌套，也可以复用多次。在css文件中定义样式，然后在引入使用。

Elasticsearch学习笔记(2）

m0_74293254的博客

09-28

1085

创建索引: 使用 PUT 请求来定义索引及其映射。创建文档: 使用 POST 请求将数据添加到索引。读取文档: 使用 GET 请求获取特定文档。更新文档: 使用 POST 加上 _update 操作来修改现有文档。删除文档: 使用 DELETE 请求删除指定文档。删除索引: 使用 DELETE 请求删除整个索引。请求方式：POST请求格式：/{索引库名}/_doc/文档id示例：POST /my_index/_doc/1 { "field": "value" }

Coursera_ Algorithms I 学习笔记：Module_3_Analysis_of_Algorithm_Introduction