Language-Aligned Waypoint (LAW) Supervision

22 篇文章 60 订阅 ¥19.90 ¥99.00
本文提出了语言对齐监督方案(LAW)以改进视觉语言导航(VLN)任务,解决了智能体在遵循语言指令时偏离路径的问题。LAW鼓励智能体在每个导航步骤中向与指令对齐的路径前进,从而提供更好的监督信号。通过在VLN-CE数据集上进行实验,研究发现LAW监督提高了模型在指令遵循和子指令完成度方面的性能,尤其是在路径不匹配的情况下。
摘要由CSDN通过智能技术生成

视觉语言导航任务的一个挑战是如何处理智能体偏离参考路径的“偏离路径”场景(即智能体偏离指令规定的参考路径)。先前的工作根据从智能体的位置到目标点的最短路径来对智能体进行监督,这种以目标为导向的监督通常与指令的描述不一致,并且先前工作采用的评估指标并不能衡量智能体能够遵循多少语言指令。在本文,提出一种语言对齐监督方案,以及一个可以衡量智能体在导航过程中完成的子指令数量的新度量

语言对齐监督方案鼓励智能体在每一个导航时间步都向与语言对齐的路径上(即参考路径)最近的路点移动,从而监督智能体更好地遵循指令(见图1)。

图中的蓝色路径表示语言指令的参考路径,红色路径代表到目标点的最短路径;与语言对齐的蓝色箭头鼓励处于任何位置(黑色圆圈)的智能体向与语言指令对齐路径上最近的路点移动,对于VLN任务来说,与目标导向的监督(红色箭头)相比,这是一个更好的监督信号。

1 Approach

本文所提方法在VLN-CE数据集上进行评估。VLN-CE数据集中包含语言指令和参考路径的导航集,其中的参考路径

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

初篱

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值