SLAM文献之-Large-Scale LiDAR Consistent Mapping using Hierarchical LiDAR Bundle Adjustment

点云SLAM

于 2025-05-27 21:02:04 发布

阅读量627

点赞数 15

分类专栏： SLAM 文章标签：人工智能激光SLAM 3D深度学习层次化束束调整BA HBA优化大场景建图定位 SLAM

本文链接：https://blog.csdn.net/qq_36812406/article/details/148144604

版权

SLAM 专栏收录该内容

32 篇文章

订阅专栏

《Large-Scale LiDAR Consistent Mapping using Hierarchical LiDAR Bundle Adjustment》提出了一种高效且全局一致的激光雷达地图构建方法，结合了层次化的束束调整（Hierarchical Bundle Adjustment, HBA）和位姿图优化（Pose Graph Optimization, PGO），旨在解决传统方法在大规模场景下的计算瓶颈和地图一致性问题。
在这里插入图片描述
如图 1

算法原理与公式推导

1. 传统方法的局限性

位姿图优化（PGO）：通过最小化相邻帧之间的相对位姿误差来优化轨迹，计算效率高，但无法直接优化点云的一致性，可能导致地图局部不一致。
激光雷达束束调整（LiDAR BA）：通过最小化点到平面的距离来优化地图一致性，精度高，但在大规模地图中计算复杂度为 $O(N^3)$ ，难以实时应用。

2. 层次化束束调整（Hierarchical BA）

为解决上述问题，论文提出了层次化的束束调整方法，将整个优化过程分为两个阶段：

a. 自底向上的局部优化

构建金字塔结构：将所有帧按照时间顺序划分为多个层级，每一层包含若干帧，形成金字塔结构。
1、局部优化结果的抽象与上传
每层优化后，需要对局部结果进行摘要提取与合并，用于上传到下一层：
1. 聚合帧位姿与残差分布；
2. 合并为子图（Submap），形成一个更高层次的节点；
3. 子图的相对变换（T_sub_i ↔ T_sub_j）再用于上一层优化。
  
  这种方式形似 “小地图 → 大地图”，支持渐进式构图与优化。
2、多层次 BA 框架图示

Layer 3:         [Submap A] — [Submap B] — ...
                    ↑           ↑
Layer 2:         [Cluster A1]  [Cluster B1] ...
                    ↑           ↑
Layer 1:     [Frame_1] [Frame_2] ... [Frame_N]

每一层进行局部 BA，生成更上一层节点间约束。顶层进行全局优化（PGO）。

局部束束调整：在每一层中，对相邻帧进行局部的束束调整，最小化点到平面的距离误差。
优化目标函数：

$\min_{\mathbf{T}_i} \sum_{i=1}^{N} \sum_{j=1}^{M_i} \left( \mathbf{n}_{ij}^\top (\mathbf{T}_i \mathbf{p}_{ij} - \mathbf{q}_{ij}) \right)^2$

其中：
- $\mathbf{T}\_i$ ：第 $i$ 帧的位姿。
- $\mathbf{p}\_{ij}$ ：第 $i$ 帧中第 $j$ 个点。
- $\mathbf{q}\_{ij}$ ：对应的平面上的点。
- $\mathbf{n}\_{ij}$ ：对应平面的法向量。

通过局部优化，减少了每次优化的问题规模，提高了计算效率。

b. 自顶向下的全局优化

构建位姿图：在金字塔的顶层，构建帧之间的位姿图，节点表示帧，边表示帧之间的相对位姿约束。自顶向下的位姿图优化过程旨在减少底层的层次化 BA（Bundle Adjustment）过程中产生的位姿估计误差。底层优化仅考虑了在同一局部窗口中可同时观测到的特征，而忽略了跨不同局部窗口观测到的特征。如图 1 所示，位姿图在金字塔结构中以自顶向下的方式构建。在金字塔的每一层中，图中的因子表示相邻帧之间的相对位姿。具体地，第 $i$ 层中，节点 $x^i_j$ 与 $x^i_{j+1}$ 之间的因子误差项定义为：

$\mathbf{e}^{i}_{j,j+1} = \text{Log} \left( \left( \mathbf{T}^{i*}_{j,j+1} \right)^{-1} \left( \mathbf{T}^{i}_j \right)^{-1} \mathbf{T}^{i}_{j+1} \right)^\vee$
$c\left(\mathbf{x}^{i}_j, \mathbf{x}^{i}_{j+1} \right) = \left( \mathbf{e}^{i}_{j,j+1} \right)^\top \left( \boldsymbol{\Omega}^{i}_{j,j+1} \right)^{-1} \mathbf{e}^{i}_{j,j+1}$
其中， $\boldsymbol{\Omega}^i_{j,j+1}$ 是位姿 $\mathbf{x}^i_j$ 与 $\mathbf{x}^i_{j+1}$ 之间的相关性矩阵（correlation matrix），其中：

$\in \mathcal{L}$ ：表示层级索引集合 $\mathcal{L} = \{1, \cdots, l\}$ ，共 $l$ 层；
$\in \mathcal{F}^i$ ：表示第 $i$ 层中节点索引集合 $\mathcal{F}^i = \{0, \cdots, N_i - 1\}$ 。

该相关性矩阵 $\boldsymbol{\Omega}^i_{j,j+1}$ 是通过自底向上的层次化 BA 优化过程所得到的 Hessian 矩阵 $H$ 的逆计算得出：

$\boldsymbol{\Omega}^i_{j,j+1} = \left( \mathbf{H}^i_{j,j+1} \right)^{-1}$

这表示：底层的局部 BA 为顶层图优化提供了信息矩阵，即顶层的边约束。
由于节点 $\mathbf{x}^i_{j+1}$ 与 $\mathbf{x}^{i-1}_{s \cdot j}$ 本质上表示同一个节点在不同分辨率层级中的表示，因此可作同一处理。这种结构通常出现在金字塔层次下采样图中，其中 $s$ 是层级缩放因子（如 2 倍下采样）。可以将公式 (4) 中的代价项可以简化为：
$\mathbf{e}^i_{j, j+1} = \text{Log} \left( \left(\mathbf{T}^{i*}_{j,j+1}\right)^{-1} \left(\mathbf{T}^1_{s^{i-1},j}\right)^{-1} \mathbf{T}^1_{s^{i-1},(j+1)} \right)^\vee$

$\mathbf{e}^i_{j,j+1}$ ：第 $i$ 层中第 $j$ 与 $j + 1$ 个节点之间的误差项。
$\mathbf{T}^{i*}_{j,j+1}$ ：该层中第 $j$ 与 $j + 1$ 帧之间的“观测”相对变换（通常来自低层优化结果或IMU等）。
$\mathbf{T}^1_{s^{i-1}, j}$ 、 $\mathbf{T}^1_{s^{i-1}, (j+1)}$ ：从第 $i - 1$ 层中根据下采样因子 $s^{i-1}$ 投影出来的第 $j$ 、 $j + 1$ 帧的全局位姿。
$\text{Log}(\cdot)^\vee$ ：将变换矩阵转化为李代数形式，即位姿误差向量（例如SE(3)中的6维向量）。
$c\left(\mathbf{x}^1_{s^{i-1}, j}, \mathbf{x}^1_{s^{i-1}, (j+1)}\right) = \left(\mathbf{e}^i_{j,j+1}\right)^\top \left(\mathbf{\Omega}^i_{j,j+1}\right)^{-1} \mathbf{e}^i_{j,j+1}$
$c(\cdot, \cdot)$ ：第 $i$ 层中两帧之间的优化代价。
$\mathbf{\Omega}^i_{j,j+1}$ ：误差项的协方差矩阵（或其近似），衡量误差的重要性，通常由下层BA过程的 Hessian 矩阵反转得到。
$\left(\cdot\right)^\top \left(\mathbf{\Omega}^{-1}\right) \left(\cdot\right)$ ：标准的马氏距离形式，用于加权平方误差。

其中 $\in \mathcal{L}$ ， $\in \mathcal{F}^i$ ，原始位姿图（见图1）被简化为图4所示的形式。需要注意的是，当下采样率 $s < w$ （窗口宽度）时，出现在相邻局部窗口重叠区域中的帧可能会贡献多个代价项（每个局部窗口会贡献一个）。因此，最终需要最小化的目标函数为：

$f(\mathcal{F}, \mathcal{X}) = \sum_{i \in \mathcal{L}} \sum_{j \in \mathcal{F}^i} c\left( \mathbf{x}^1_{s^{i-1} \cdot j}, \mathbf{x}^1_{s^{i-1} \cdot (j+1)} \right) \tag{6}$