- 博客(2)
- 收藏
- 关注
翻译 Speaker-Follower Models for Vision-and-Language Navigation论文翻译
1 介绍模型包括一个指令解释(follower)模块,将指令映射到动作序列;和一个指令生成(speaker)模块,将操作序列映射到指令(图1),两者都使用标准的sequence-to - equence架构实现。speaker学习为视觉路线提供文本指令,而follower学习为提供的文本指令遵循路线(预测导航动作)。虽然将speaker和follower结合起来的显式概率推理是计算语用学[14]...
2019-05-28 09:59:00 1333
翻译 融合CV和NLP的视觉语义导航
摘要:视觉-语言导航(VLN/vision-language navigation)是引导具身智能体(embodied agent)在真实三维环境中执行自然语言指令的任务。在这篇论文中,我们研究的是如何解决这一任务的三大关键难题:跨模态基础标对(cross-modal grounding)、不适定反馈(ill-posed feedback)和泛化(generalization)问题。首先,我们提出...
2019-05-21 14:44:29 2332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人