2023 ICRA《Visual Language Maps for Robot Navigation》阅读笔记

初篱

已于 2023-09-11 11:16:55 修改

阅读量1.5k

点赞数 2

分类专栏：视觉语言导航VLN 文章标签：笔记人工智能

于 2023-06-13 08:00:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44100524/article/details/131040949

版权

视觉语言导航VLN 专栏收录该内容

27 篇文章 ¥29.90 ¥99.00

订阅专栏

研究提出VLMaps，一种融合预训练视觉语言特征与3D重建的空间地图表示，用于机器人自然语言导航。VLMaps允许机器人理解和定位开放词汇空间目标，如“在沙发和电视之间”，并生成不同实施例的障碍物地图。实验表明，VLMaps在多目标导航和空间目标导航中优于现有方法，且适用于真实世界环境。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

链接

1 Abstract and Introduction

视觉语言导航可以使用预先训练的现有的视觉语言模型来将图像与对象目标的自然语言描述相匹配，但它与绘制环境的过程仍然脱节，缺乏经典几何地图的空间精度。为了解决这个问题，我们提出了VLMaps，这是一种空间地图表示，它将预训练的视觉语言特征与物理世界的3D重建直接融合在一起。VLMaps可以使用标准探索方法从机器人上的视频馈送中自主构建，并在没有额外标记数据的情况下实现地图的自然语言索引。具体来说，当与大型语言模型（LLM）相结合时，VLMaps可以用于（i）将自然语言命令翻译成一系列直接定位在地图中的开放词汇导航目标（除了先前的工作之外，这些目标可以是空间的，例如“在沙发和电视之间”或“椅子右侧三米处”），以及（ii）可以在具有不同实施例的多个机器人之间共享，以在飞行中生成新的障碍物地图（通过使用障碍物类别的列表）。在模拟和真实世界环境中进行的大量实验表明，

了解本专栏

博客等级

码龄6年

36
原创

162
点赞

189
收藏

304
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

代码复现1——Matterport3d数据集下载
赴海看鲸落.: 我想复现的是https://github.com/YanyuanQiao/Open-Nav，他有部分实现是VLN-CE的
代码复现1——Matterport3d数据集下载
赴海看鲸落.: The active scene does not contain semantic annotations. Loaded navmesh data/scene_datasets/mp3d/x8F5xyUWy9e/x8F5xyUWy9e.navmesh Initializing task VLN-v0 Process ForkServerProcess-1: Traceback (most recent call last): File "/home/omnisky/habitat-lab/habitat_baselines/utils/env_utils.py", line 31, in make_env_fn env = env_class(config=config, dataset=dataset) File "/home/omnisky/habitat-lab/habitat/core/env.py", line 336, in __init__ self._env = Env(config, dataset) File "/home/omnisky/habitat-lab/habitat/core/env.py", line 112, in __init__ self._task = make_task( File "/home/omnisky/habitat-lab/habitat/tasks/registration.py", line 21, in make_task return _task(**kwargs) File "/home/omnisky/habitat-lab/habitat/tasks/vln/vln.py", line 92, in __init__ super().__init__(**kwargs) assert n > 0, "n (counts) have to be positive" AssertionError: n (counts) have to be positive
代码复现1——Matterport3d数据集下载
初篱: 具体报错看一下
代码复现1——Matterport3d数据集下载
赴海看鲸落.: 你好，我下载了Mp3d的数据集，在执行的时候无法正确加载环境的语义注释文件（.ply文件），这是为什么呢
代码复现4—Robo-VLN
weixin_47566040: 请速速更新！！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

初篱 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。