【论文笔记】3D LiDAR Mapping in Dynamic Environments Using a 4D Implicit Neural Representation-CSDN博客

本文链接：https://blog.csdn.net/weixin_45657478/article/details/137344764

原文链接：https://www.ipb.uni-bonn.de/wp-content/papercite-data/pdf/zhong2024cvpr.pdf

1. 引言

为实现户外场景的精确3D重建，需要考虑运动物体的动态。过去的SLAM方法可使用多种策略处理动态：（1）使用预处理步骤从输入过滤动态，这要求对场景的语义解释；（2）在地图表达中建模占用，可通过回顾性地移除空空间的测量隐式移除动态；（3）将其纳入状态估计，对来自动态和静态部分的测量进行建模。本文方法使用（3），在地图表达中直接建模动态，得到时空占用地图表达。

隐式神经表达启发了本文对动态环境的4D重建。本文将时间相关的截断有符号距离函数（TSDF）编码为隐式神经场景表达。本文以连续激光雷达点云为输入，在每帧生成TSDF，用于提取网孔。背景的TSDF在整个序列中不变，容易从4D信号中提取出来，作为静态地图，可用于从原始点云中分割动态物体。与显式的体素表达相比，神经隐式表达可保留丰富的地图细节。

3. 本文的方法

本文的输入为点云序列 $\mathcal S_{1:N}=(\mathcal S_1,\cdots,\mathcal S_N)$ 及其相应的全局姿态 $T_t\in\mathbb R^{4\times4},t\in[1,N]$ 。点云 $\mathcal S_t=\{s^1_t,\cdots,s^{M_t}_t\}$ 中的点 $s_t^i\in\mathbb R^3$ 。本文的目标是重建4D TSDF并保留静态3D地图。

3.1 地图表达

时间表达：TSDF为点 $p\in\mathbb R^3$ 的标量函数，其值为点到最近表面的距离（若距离大于阈值，则将距离设置为阈值）。当点位于空空间或测量表面前时，符号为正；当点位于占用空间或测量表面后时，符号为负。

在动态场景中，点的有符号距离值可能会随时间变化。但对于静态物体的点而言，其有符号距离值不变。本文的思想是使用 $K$ 个全局共享的基函数 $\phi_k:\mathbb R\rightarrow \mathbb R$ 表达各点的时变SDF。则 $t$ 时刻，点 $p$ 的TSDF为
$F(p,t)=\sum_{k=1}^Kw_p^k\phi_k(t)$