Speaker-Follower Models for Vision-and-Language Navigation

Fried D, Hu R, Cirik V, et al. Speaker-follower models for vision-and-language navigation[C]//Advances in Neural Information Processing Systems. 2018: 3314-3325.

项目主页
开源代码

Abstract
  • Follower:根据自然语言描述description预测路径route
  • Speaker:给定路径route生成指令description
  • 翻译:自然语言指令指导下的导航任务为指令followers带来了挑战,自然语言指令通常仅识别一些高级的决策标志,而不是低级的运动行为,许多丢失的信息都必须通过感知上下文来推断。在机器学习环境中,这是一个双重挑战:收集足够多的标记过的数据保证推理过程的学习很困难,使用通用序列模型实现推理过程也很难。在这里,我们提出了一种方法在这些问题的基础上使用嵌入式speaker解决了视觉语言导航问题,用这个speaker模型实现对数据增加新的标记数据和实现实用性推理,并且speaker模型能够评估候选动作序列的优劣性。这两个步骤均由全景动作空间支持,该动作空间反映了人类生成指令的细粒度。实验表明,该方法的三个要
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值