晓shuo-CSDN博客

本文介绍了DialMAT模型，用于解决智能体在复杂环境中通过对话获取信息完成任务的挑战。博客概述了DialFRED任务，并详细说明了DialMAT的架构，包括提问模块（Questioner）和基于矩的对抗执行器（MAPer）。重点介绍了基于矩的对抗训练（MAT），提升模型在不确定环境下的鲁棒性，并通过跨模态并行特征提取结合语言和视觉信息，提高任务执行效果。

2024-09-29 20:16:45 1329

原创 DialFRED基准：具有对话能力的具身智能Agent

本文介绍了DialFRED基准，旨在解决机器人在复杂任务执行中处理自然语言指令的挑战。通过引入对话机制，DialFRED让机器人能够主动提问并从用户反馈中获取信息，解决任务中的歧义。博客详细分析了DialFRED的数据集构成、任务类型，以及提问者-执行者框架，展示了如何通过强化学习和启发式方法优化机器人的任务执行表现。

2024-09-29 20:00:16 1234

原创 FLTRNN：基于大型语言模型的机器人复杂长时任务规划

FLTRNN框架通过任务分解、递归神经网络和规则思维链的设计，解决了LLM在长时任务规划中常见的忠实性问题。

2024-09-05 13:29:42 2828

原创基于视觉-语言模型的机器人任务规划：ViLaIn框架解析

本文介绍了ViLaIn框架如何通过视觉和语言模型生成符号化任务描述，并借助符号规划器为机器人生成可执行的任务计划。

2024-09-05 13:10:40 1366

原创基于时序差分的无模型强化学习：Q-learning 算法详解

本文主要探讨无模型强化学习中的时序差分方法，重点介绍了 Q-learning 算法。通过阐述 Q-learning 的核心原理、状态-动作值函数的更新方式，以及其在离线策略中的应用，本文展示了该算法在复杂环境中寻找最优策略的强大能力。此外，还对比了 Q-learning 与其他强化学习方法的异同，强调了其在探索与利用平衡、样本复杂度上的优势。

2024-09-05 10:54:16 1571

原创强化学习——马尔可夫决策过程的理解

这篇文章介绍了马尔可夫决策过程（MDP）及其相关概念。它解释了MDP的基本结构，包括状态、动作、策略、状态价值函数和动作价值函数，并讨论了这些概念如何在强化学习中帮助智能体最大化累积奖励。文章还介绍了贝尔曼期望方程，用于计算状态价值和动作价值。整体内容旨在阐明MDP在强化学习中的应用和数学基础。

2024-09-01 17:39:26 2251

原创 ChatGLM-6B使用与微调

ChatGLM-6B使用与微调

2024-07-13 21:46:40 1584 1

原创 U-2 Net原理+代码实战教程

介绍了U2-Net网络的原理以及代码实战教程

2024-07-12 13:55:04 2433 6

原创具身智能方案——基于“想象链”机制的MineDreamer智能体

介绍了论文《Minedreamer: Learning to follow instructions via chain-of-imagination for simulated-world control》

2024-06-12 21:47:45 1380

原创机器人多任务操作的SAM-E架构

介绍ICML2024论文《SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation》

2024-06-12 21:39:59 1277

原创视觉与语言导航模型I2EDL

介绍了论文《I2EDL: Interactive Instruction Error Detection and Localization》

2024-06-12 21:27:18 1127

原创视觉-语言模型零样本推理方法

介绍了CVPR2024论文《Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning》

2024-06-12 21:20:39 1973 2

原创利用Python的NLTK库来查询指定单词的同义词

利用Python的NLTK库来查询指定单词的同义词

2024-06-11 16:24:28 1543

原创逆向计划搜索框架CLIPS

解读AAMAS2024论文《Pragmatic Instruction Following and Goal Assistance via Cooperative Language-Guided Inverse Planning》

2024-06-11 11:34:43 955

原创结合LLM的具身指令执行框架OPEx

解读AAMAS2024论文《OPEx: A Large Language Model-Powered Framework for Embodied Instruction Following 》

2024-06-11 11:24:31 1414

原创 LLM零样本任务性能的通用提示检索机制UPRISE

解读EMNLP2023论文《Uprise: Universal prompt retrieval for improving zero-shot evaluation》

2024-06-10 22:29:26 1488

原创跨语言链式思考推理的提示技术CLP

解读EMNLP2023论文《Cross-lingual Prompting: Improving Zero-shot Chain-of-Thought Reasoning across Languages》

2024-06-10 22:19:19 1629

原创 Recognize Anything: A Strong Image Tagging Model（RAM模型使用方法）

详细介绍了RAM模型的使用方法

2024-06-09 13:38:06 2656

原创 AI2THOR 2.1.0使用教程

详细介绍了AI2THOR 2.1.0使用教程，包括安装要求和示例代码

2024-06-09 13:10:22 4935 3

原创 CLIP计算图片与文本相似度（多幅图片与一个文本）

本文介绍了使用CLIP计算多幅图片和一个文本之间相似度的方法，并提供了完整的代码

2024-06-07 10:37:48 9230

原创场景图生成网络——RelTR（TPAMI2023）

介绍了TPAMI2023提出的ReITR场景图生成网络

2024-06-07 09:57:12 2230 3

原创 LLM的物理推理与规划方法E2WM

NeurIPS2024论文《Language models meet world models: Embodied experiences enhance language models》

2024-06-06 15:23:43 1735

原创 BERT应用——文本间关联性分析

本文结合了自然语言处理（NLP）和深度学习技术，旨在分析一段指定的任务文本中的动词，并进一步探讨这个动词与一系列属性之间的关联性。具体技术路径包括文本的词性标注、语义编码和模型推断。

2024-06-06 14:46:26 2866

原创 BERT应用——文本相似度计算

本文展示了如何利用BERT模型计算两个文本字符串之间的余弦相似度。

2024-06-06 14:03:20 6917 1

原创自然语言指令执行机器人控制策略GRIF

CoRL2023论文《Goal Representations for Instruction Following: A Semi-Supervised Language Interface to Control》

2024-06-06 13:40:13 1299

原创具身指令跟随模型LACMA

介绍了论文：EMNLP2023《LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction Following》

2024-06-05 16:09:04 1202

原创多阶段任务自然语言指令执行方法GOALNET

AAAI2024论文《GOALNET: Interleaving Neural Goal Predicate Inference with Classical Planning for Generalization in Robot Instruction Following》

2024-06-05 14:18:27 1061

原创论文解读——ICLR2024《Online Continual Learning For Interactive Instruction Following Agents》

Online Continual Learning For Interactive Instruction Following Agents

2024-06-04 10:12:44 1084

原创论文解读——CVPR2022《One step at a time: Long-horizon vision-and-language navigation with milestones》

介绍了CVPR2022的具身智能方向的论文《One Step at a Time: Long-Horizon Vision-and-Language Navigation with Milestones》

2024-06-03 20:37:27 1265

原创 IEEE Robotics and Automation Letters（RAL）期刊投稿时间记录

2024.1.15 submittion2024.1.16 Under review2024.3.2 Decision pending2024.3.6 Revise and resumption2024.4.1Resubmit，Under review2024.5.16 Decision pending2024.5.22 Accept

2024-05-30 13:05:50 3429 10

原创具身智能论文（四）

具身智能最新论文，来源NeurIPS2023

2024-05-14 19:21:23 2203

具体来说，Node2Vec首先从图中的每个节点出发执行多次随机游走，生成大量的节点序列，这些序列在概念上类似于自然语言处理中的句子，其中的节点则相当于单词。随后，利用Skip-Gram模型，Node2Vec将这些“句子”作为输入，通过最大化节点序列中的共现概率来学习节点的向量表示。Node Embedding，节点嵌入，旨在将图中的节点映射到一个低维度的连续向量空间中，以便在这一空间内，通过向量的几何关系反映出节点在原图中的拓扑结构和节点间的关系等属性。

2024-05-14 08:38:00 553

原创强化学习——马尔可夫奖励过程的理解

介绍了强化学习中的马尔可夫奖励过程的理解

2024-05-13 21:16:04 2421 1

原创强化学习——马尔可夫过程的理解

介绍了强化学习中的马尔可夫过程的理解

2024-05-13 21:15:29 1402

空空如也

空空如也