Language-Aligned Waypoint (LAW) Supervision

初篱

已于 2024-01-06 20:44:33 修改

阅读量441

点赞数 10

分类专栏：视觉语言导航VLN 文章标签：人工智能深度学习

于 2024-01-06 16:02:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44100524/article/details/135412217

版权

视觉语言导航VLN 专栏收录该内容

22 篇文章 60 订阅 ¥19.90 ¥99.00

订阅专栏

本文提出了语言对齐监督方案（LAW）以改进视觉语言导航（VLN）任务，解决了智能体在遵循语言指令时偏离路径的问题。LAW鼓励智能体在每个导航步骤中向与指令对齐的路径前进，从而提供更好的监督信号。通过在VLN-CE数据集上进行实验，研究发现LAW监督提高了模型在指令遵循和子指令完成度方面的性能，尤其是在路径不匹配的情况下。

摘要由CSDN通过智能技术生成

视觉语言导航任务的一个挑战是如何处理智能体偏离参考路径的“偏离路径”场景（即智能体偏离指令规定的参考路径）。先前的工作根据从智能体的位置到目标点的最短路径来对智能体进行监督，这种以目标为导向的监督通常与指令的描述不一致，并且先前工作采用的评估指标并不能衡量智能体能够遵循多少语言指令。在本文，提出一种语言对齐监督方案，以及一个可以衡量智能体在导航过程中完成的子指令数量的新度量。

语言对齐监督方案鼓励智能体在每一个导航时间步都向与语言对齐的路径上（即参考路径）最近的路点移动，从而监督智能体更好地遵循指令（见图1）。

图中的蓝色路径表示语言指令的参考路径，红色路径代表到目标点的最短路径；与语言对齐的蓝色箭头鼓励处于任何位置（黑色圆圈）的智能体向与语言指令对齐路径上最近的路点移动，对于VLN任务来说，与目标导向的监督(红色箭头)相比，这是一个更好的监督信号。

1 Approach

本文所提方法在VLN-CE数据集上进行评估。VLN-CE数据集中包含语言指令和参考路径的导航集，其中的参考路径

了解本专栏

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

初篱 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。