TextPlace: Visual Place Recognition and Topological Localization Through Reading Scene Texts[2020]

最新推荐文章于 2024-09-21 16:00:26 发布

lizhaohu01

最新推荐文章于 2024-09-21 16:00:26 发布

阅读量344

点赞数

分类专栏：视觉定位文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010260681/article/details/108098806

版权

视觉定位专栏收录该内容

7 篇文章 5 订阅

订阅专栏

本文主要是利用hight level的信息，textual进行地点识别，也可以认为是粗定位的网络

分为两个阶段：1）建图阶段，生成texture拓扑结构。2）在线query定位阶段。

整体框架结构：

3.2. Text Detection and Recognition

使用重新训练的TextBoxes++网络进行text的提取

3.3.1 Text Filtering

为了减少text检测的误差，定义了一种预处理，使用Levenshtein distance，

大致意思就是尽量相似，比如：Levenshtein distance between “sitting” and “kitten” is 3（itt相等）

3.3.2 Textual Descriptor

filter结果之后就是提取textual的feature，这里使用字符串的语义以及bounding box的位置信息

3.4. Topological Mapping

拓扑图中每个节点代表一张图（包含其textural和camera 的pose），不同节点之间的边表示relative pose（可以通过视觉里程计得到），每当一定的距离就衍生一个新的节点（可以是keyframe）

3.5. Place Recognition

定义两张图的相似度计算：

Y表示每个节点，q是query，m是map，I表示map中第I个节点，Lk表示文本的长度，d表示3.3.1中的距离。，因此这里是定义了两个节点中textural的语义相似度。

，Ak is the bounding box area of the kth text string in Yq,因此这里定义了IOU的相似度。

最终的相似度

3.6. Topological Localization

整体分为三步：: 1) initialization, 2) pose tracking and update and 3) re-localization.

3.6.1 Initialization

由于不应该每次定位都是全局节点进行匹配，因此一旦当某个节点和map中的节点出现很高的相似度的时候算法完成初始化：

3.6.2 Pose Tracking and Update

同slam中的一样一旦初始化好了之后就进行tracking，同时一个slid window滑动窗口和quey进行匹配绑定

3.6.3 Re-Localization

当时间长了tracking飞了之后同初始化的时候的办法一样，要进行重定位，再次纠正slid windows

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。