MapTR, MapTRv2学习

喵喵不爱吃鱼

已于 2024-08-13 14:16:22 修改

阅读量4.2k

点赞数 14

分类专栏：建图文章标签：学习

于 2024-04-30 19:47:06 首次发布

本文链接：https://blog.csdn.net/weixin_42391513/article/details/138355264

版权

建图专栏收录该内容

1 篇文章

订阅专栏

本文深入解析MapTR与MapTRv2在实时建图算法领域的创新，详细探讨了这两种方法如何通过DETR-like网络结构、permutation-equivalent模型、层次化查询嵌入等技术解决传统建图算法的局限性。文章还对比了MapTRv1与v2版本的核心贡献，如v2版的decoupled self-attention、中心线分割和模型结构的改进，以提升效率和准确性。此外，文章总结了这两种方案在在线高精矢量化地图构建方面的优势，提供了从道路拓扑建模到实例级匹配的全面视角。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、MapTR

1.1 MapTR概述

已有的实时建图算法：

目标检测？无法表达不规则实例
语义分割？缺乏拓扑结构 HDMapNet（语义分割+后处理）
图结构？稀疏图，复杂度过高 InstraGraM（点检测+GNN）
Auto-regression？VectorMapNet （已知前n个车道关键点，预测n+1）

MapTR提出一种DETR-like（一种基于transformer的目标检测网络）的端到端的HD矢量地图网络结构。

permutation-equivalent：将地图实例模拟成一堆点集（并非单一起始结束点序列，而是一堆点集不同排列方式的组合）。分为polyline和polygon两类要素
贡献点不在于Encoder，而在于获得BEV特征后，如何处理BEV特征。

1.2 模型结构

cost计算

Instance-level Matching ：实例级匹配cost计算（分类cost和回归cost（代码中是用的点对点cost））
Point-level Matching ：

loss计算（主要是点对点之间的回归，而不是instance级别的回归）

Classification Loss

Point2point Loss

Edge Direction Loss （约束点序列）

二、MapTR v2

2.1 v1 核心贡献

permutation-equivalent modeling ：将地图实例模拟成一堆点集（并非单一起始结束点序列，而是一堆点集不同排列方式的组合）。
hierarchical query embedding （层次化查询嵌入）：类似在自然语言处理中，如果你有一个包含嵌套结构的句子或段落，你可能会使用层次化查询嵌入来将这些信息嵌入到神经网络模型中，以便模型可以有效地处理这种层次结构的数据。

2.2 v1 vs v2

decoupled self-attention
- transformer 复杂度是 n^2，(point query * instance query) ^ 2，计算量巨大。
- 改为decoupled sef-attention，inter-ins self-attention + intra-ins self-attention
auxiliary one-to-many set prediction
center-line
取消了部分类别的permutation，如center-line
PV vs BEV
dense supervision