如何在2D地图上通过视觉进行重定位？

最新推荐文章于 2025-05-15 23:59:27 发布

3Ｄ视觉工坊

最新推荐文章于 2025-05-15 23:59:27 发布

阅读量96

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1MjY4MTA1MQ==&mid=2247676194&idx=3&sn=7cf81fc2772089703ed560a5bc010e5a&chksm=fa06ff45ac550ab951f3e782ebaf6f9ca1e5a9254d72da4ba8591ffe4e7d81195731fea40e2f&scene=126&sessionid=0

版权

文章讨论了利用3D视觉在2D地图上的有限范围重定位方法，特别关注LaLaLoc系列工作，包括隐式布局表示的LalaLoc和显式3D建模的LaLaLoc++。这些技术通过学习RGB图像和平面图间的共享隐空间，实现了在未访问环境中的低成本定位，适用于扫地机器人等设备。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这是近日我们《3D视觉从入门到精通》知识星球的一位小伙伴提出的问题：“通过视觉在2D地图（地图上有墙、门等信息）上进行有限范围内的重定位，有没有比较成熟的方法？”

在回答中，我们星球的嘉宾以及大佬给出了自己的一些想法。

然后，结合我之前看到过的一个系列工作，这里我想再扩展延申一下。

这是之前研究过的一篇文章，也是一个系列工作。即在未访问环境下，通过房间布局平面图进行定位。

论文：LaLaLoc: Latent Layout Localisation in Dynamic, Unvisited Environments（ICCV 2021）

LaLaLoc++: Global Floor Plan Comprehension for Layout Localisation in Unvisited Environments (ECCV 2022)

项目地址：https://github.com/ActiveVisionLab/LaLaLoc

首先是第一个LalaLoc，它通过房间布局的隐式表达来进行定位，方法是通过网络学习从RGB全景图像和已知的平面图推断的布局之间共享的一个隐空间，在隐空间中引入直接的跨模态姿态优化。

然后是LalaLoc++，相比于LaLaLoc，这是其改进版，LaLaLoc要求首先使用平面来构造场景的显式三维表示，这个过程要求对场景几何体进行假设，而LaLaLoc++引入了一个全局平面图理解模块，该模块能够直接从2D平面图中密集推断场景结构，消除了对显式建模或者渲染的需求。

感兴趣的读者可以下载两篇文章研究一下，他们提供了一种在未访问环境下通过房间布局平面图进行定位的方式，通过仅视觉的解决方案，成本更低，而且房间布局平面图这一地图形式所占的存储量也很小，其方案很适合部署在扫地机器人上面。

最后，上述讨论以及相关文章分享解读都可以在我们的星球中找到！下面是我们的星球二维码，欢迎大家扫码加入！！！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。