刚性配准与非刚性配准

最新推荐文章于 2025-02-24 16:45:31 发布

瓴龍

最新推荐文章于 2025-02-24 16:45:31 发布

阅读量3.1k

点赞数 3

分类专栏：学习笔记 CV 文章标签：配准图形学

本文链接：https://blog.csdn.net/dragonylee/article/details/132149631

版权

学习笔记同时被 2 个专栏收录

7 篇文章

订阅专栏

4 篇文章

订阅专栏

前言

“配准”这个词其实应用的场景很多，例如在AR设备上进行定位需要用到的图像配准，需要提前存储图像的特征信息，然后用AR设备的摄像头实时计算图像特征并进行匹配，配准成功后进行跟踪。

本文所说的“配准”，是应用于三维点云或者mesh之中的，在我看过的文献中，“配准”（registration）和“对齐”（alignment）这两个词都用于描述这个意思。

根据物体本身是否发生形变，可以分为刚性配准和非刚性配准：刚性配准所有顶点共用一个变换矩阵，非刚性配准则不是。

刚性配准

假设两个点云分别用 $\text{source}:\mathbf{X}=\{\mathbf{x}_1,...,\mathbf{x}_m\}$ 和 $\text{target}:\mathbf{Y}=\{\mathbf{y}_1,...,\mathbf{y}_n\}$ 表示，刚性配准的目标就是要找到最优的刚性变换 $T$ ，使得 $T(\mathbf{X})$ 和 $\mathbf{Y}$ 尽可能重合。用最优化的形式表述为：
$\min_{\mathbf{R},\mathbf{t}}{\frac{1}{m}\sum_{i=1}^m || \mathbf{R}\mathbf{x}_i+\mathbf{t}-\mathbf{y}(\mathbf{x}_i) ||^2}$
其中 $\mathbf{y}(\mathbf{x}_i)$ 为target中对应的顶点。

求解这个最优化问题最常用的方法就是迭代最近点算法（Iterative Closest Point, ICP），按照最优化形式分解为两个步骤：

最近点查找：对于 $\mathbf{X}$ 中的每个顶点 $\mathbf{x}$ ，查找 $\mathbf{Y}$ 中最近的顶点 $\mathbf{y}(\mathbf{x})$ 作为对应点；
SVD求解最优变换：首先各自减去质心 $\mathbf{\hat{x}}=\mathbf{x}-\mathbf{\overline{x}}$ ， $\mathbf{\hat{y}}=\mathbf{y}(\mathbf{x})-\overline{\mathbf{y}(\mathbf{x})}$ ，令 $\mathbf{W}=\sum{\mathbf{\hat{x}_i}\mathbf{\hat{y}_i}^T}$ ，然后奇异值分解 $\mathbf{W}=\mathbf{U}\mathbf{D}\mathbf{V}^T$ ，则最优变换为 $\mathbf{R}^*=\mathbf{V}\mathbf{U}^T$ ， $\mathbf{t}^*=\mathbf{\overline{y}}-\mathbf{R}^*\mathbf{\overline{x}}$ 。

最近点查找往往需要耗费很多时间，常见的可以用kd-tree进行加速；在确定顶点对应关系后，最优变换就存在闭合形式的解。ICP算法就是首先确定一个初始解 $\mathbf{R}_0,\mathbf{t}_0$ ，然后不断地迭代进行上面两个步骤，直至满足收敛条件。初始解例如可以人为在两个点云上标注4对对应点，然后计算得到，收敛条件可以是变换矩阵的增量小于某个阈值等等。

为了优化ICP算法的效果和速度，还有很多变种，例如：

采样点集进行匹配；
点对进行加权；
拒绝某些特殊点对，例如距离太远的；
点到点的距离，变为点到切平面的距离；

实际上从更根本的角度来看，刚性配准就是最小化一个度量函数
$\min_{T}{E(T(\mathbf{X}),\mathbf{Y})}$
按照我的经验，度量函数 $E$ 设置为点云的 chamfer distance，直接进行迭代优化（例如在Pytorch框架下反向传播优化）也能取得不错的配准效果。

非刚性配准

相对于刚性配准，非刚性配准的点云或者mesh是可以产生形变的。变形模板（template, source）用 $\mathbf{X}=\{\mathbf{x}_1,...,\mathbf{x}_m\}$ 表示，配准目标（target）用 $\mathbf{Y}=\{\mathbf{y}_1,...,\mathbf{y}_n\}$ 表示，变形后的曲面用 $\hat{\mathbf{X}}=\{\hat{\mathbf{x}}_1,...,\hat{\mathbf{x}}_m\}$ 表示。如果我们用 $f_{\Theta}(\mathbf{X})$ 来表示对模板的变形，那么 $\Theta$ 就是我们待优化的参数。一般来说参数量越大，就说明模板变形的自由度越大（一般也配准得越准确），但同时优化难度和开销也越高。

基于“优化”的非刚性配准可以表示如下：
$\mathop{\text{Minimize}}\limits_{\Theta} \quad E(f_{\Theta}(\mathbf{X}),\mathbf{Y})$
其中 $E$ 表示评估两个曲面相似程度的度量函数。

在非刚性配准中，模板会发生形变，因此我们不仅希望变形后模板和目标尽可能对齐，还希望变形后的模板保持一定的形态特点（举个极端例子，模板缩成一个顶点，可能从“对齐”的度量来看是一个最优解），因此往往度量函数会包括正则化的度量。即在非刚性配准中度量函数一般为
$E=E_{\text{align}}+\alpha E_{\text{reg}}$
其中 $E_{\text{align}}$ 是对常见的非刚性配准中“形变场”（deformation field）的度量，常见的形变场的表示方式有：