2020ECVV《VLN-CE》阅读笔记

初篱

已于 2023-08-07 17:39:06 修改

阅读量726

点赞数

分类专栏：视觉语言导航VLN 文章标签：笔记

于 2023-07-06 10:10:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44100524/article/details/131557740

版权

视觉语言导航VLN 专栏收录该内容

27 篇文章 ¥29.90 ¥99.00

订阅专栏

VLN-CE是一个在连续3D环境中进行语言引导导航的任务，模拟了更接近真实世界的环境，其中代理需要执行一系列低级动作。文章介绍了从基于导航图的房间到房间任务到VLN-CE的转变，提出了一种简单的序列到序列基线模型和跨模态注意力模型。实验部分展示了模仿学习、数据增强和进度监控等技术对模型性能的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 Abstract and Introduction

1.在连续的3D环境中开发了一个语言引导的导航任务集，在该环境中，代理必须执行低级操作以遵循自然语言导航方向。具体来说，放弃了已知环境拓扑、短距离oracle导航和完美代理本地化的假设，使得环境更加接近现实环境。

2.为将任务具体化，开发了一个简单的序列到序列的基线架构以及一个基于跨模态注意力的模型。

为VLN-CE任务开发模型架构，并评估一套单输入消融，以评估设置的偏差和基线。

3.之前工作的理想假设

（1）已知拓扑。仿真环境离散，与实际环境不匹配。

（2）Oracle导航。在导航图中相邻节点之间移动，节点之间的移动类似于传送。

（3）完美的定位。代理在任何时候都会得到他们的准确位置和航向（大多数工作都使用这些数据来编码导航图中节点之间的精确几何结构，或使用精确的代理定位来构建环境的空间图），事实上，室内精确定位仍然是一个挑战。

4.连续环境中的视觉语言导航（VLN-CE）

该任务中的代理可以通过一系列低级动作（如向前移动0.25米，向左转15度）自由导航到任何无障碍点，而不是在固定节点之间传送。并且代理会面临更长的时间范围、平均动作数为55个左右，代理一

了解本专栏

博客等级

码龄6年

36
原创

162
点赞

191
收藏

308
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 2023 ICRA《Visual Language Maps for Robot Navigation》阅读笔记

下一篇：: NeurIPS 2022《Weakly-Supervised Multi-Granularity Map Learningfor Vision-and-Language Navigation》阅读笔记

最新评论

代码复现1——Matterport3d数据集下载
赴海看鲸落.: 我想复现的是https://github.com/YanyuanQiao/Open-Nav，他有部分实现是VLN-CE的
代码复现1——Matterport3d数据集下载
赴海看鲸落.: The active scene does not contain semantic annotations. Loaded navmesh data/scene_datasets/mp3d/x8F5xyUWy9e/x8F5xyUWy9e.navmesh Initializing task VLN-v0 Process ForkServerProcess-1: Traceback (most recent call last): File "/home/omnisky/habitat-lab/habitat_baselines/utils/env_utils.py", line 31, in make_env_fn env = env_class(config=config, dataset=dataset) File "/home/omnisky/habitat-lab/habitat/core/env.py", line 336, in __init__ self._env = Env(config, dataset) File "/home/omnisky/habitat-lab/habitat/core/env.py", line 112, in __init__ self._task = make_task( File "/home/omnisky/habitat-lab/habitat/tasks/registration.py", line 21, in make_task return _task(**kwargs) File "/home/omnisky/habitat-lab/habitat/tasks/vln/vln.py", line 92, in __init__ super().__init__(**kwargs) assert n > 0, "n (counts) have to be positive" AssertionError: n (counts) have to be positive
代码复现1——Matterport3d数据集下载
初篱: 具体报错看一下
代码复现1——Matterport3d数据集下载
赴海看鲸落.: 你好，我下载了Mp3d的数据集，在执行的时候无法正确加载环境的语义注释文件（.ply文件），这是为什么呢
代码复现4—Robo-VLN
weixin_47566040: 请速速更新！！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

初篱 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。