利用SVD求得两个对应点集合的旋转矩阵R和转移矩阵t的数学推导

最新推荐文章于 2025-02-14 10:51:10 发布

棕熊的肚皮

最新推荐文章于 2025-02-14 10:51:10 发布

阅读量1.9w

点赞数 51

分类专栏：几何变换 ICP 文章标签：线性代数机器学习概率论

本文链接：https://blog.csdn.net/u012836279/article/details/80351462

版权

算法同时被 3 个专栏收录

7 篇文章

订阅专栏

几何变换

4 篇文章

订阅专栏

ICP

3 篇文章

订阅专栏

1.问题描述

给定两个在d维空间中对应的点集合 $\{ p_1,p_2 ,\dots , p_n\}$ 和 $\{ q_1 ,q_2, \dots , q_n \}$ ,为了计算出它们之间的刚体变换，即 $R$ 和 $t$ ，可以将其建模为如下的数学形式：
$\sum_{i=1}^n w_i||(Rp_i+t)-q_i||^2 \tag{1}$
$w_i$ 表示每个点对之间的权重。

2. 计算转移矩阵

首先，对公式(1）求导，可以得到：
$0=\frac{\partial F}{\partial t} = \sum_{i=1}^{n}2w_i(Rp_i +t-q_i) = 2t(\sum_{i=1}^nw_i)+ 2R(\sum_{i=1}^nw_ip_i)-2\sum_{i=1}^{n}w_iq_i \tag{2}$
现在，引入点集合P的中心点 $\hat p$ 和点集合Q的中心点 $\hat q$ ，它们分别为：
$\hat p = \frac{\sum_{i=1}^{n}w_ip_i}{\sum_{i=1}^{n}w_i} \\ \hat q = \frac{\sum_{i=1}^{n}w_iq_i}{\sum_{i=1}^{n}w_i} \tag{3}$
公式(2)两边同时除以， $\sum_{i=1}^nw_i$ 则得到：
$\frac{0}{\sum_{i=1}^nw_i} = \frac{2t(\sum_{i=1}^nw_i)}{\sum_{i=1}^nw_i}+ \frac{2R(\sum_{i=1}^nw_ip_i)}{\sum_{i=1}^nw_i}-\frac{2\sum_{i=1}^{n}w_iq_i }{\sum_{i=1}^nw_i}\\ 0 = 2t+2R\hat p-2\hat q \\ \hat q-R\hat p = t \tag{4}$

将等式 $\hat q-R\hat p$ 替换到公式(1)可以得到：
$\sum_{i=1}^n w_i||(Rp_i+t)-q_i||^2\\ = \sum_{i=1}^n w_i||Rp_i+ \hat q-R\hat p -q_i||^2 \\= \sum_{i=1}^n w_i||R(p_i-\hat p)-(q_i-\hat q)||^2 \tag{5}$
公式(5)看出，我们可以利用集合 $X$ 和集合 $Y$ 表示 $p_i-\hat p$ 和 $q_i-\hat q$ ，用 $x_i$ 和 $y_i$ 分别表示新数据集合中的点。
$x_i : = p_i-\hat p \\ y_i := q_i - \hat q \tag{6}$
这时所以公式(1)可以等价于为：
$argmin\sum_{i=1}^{n} w_i ||Rx_i-y_i||^2 \tag{7}$

3. 计算旋转矩阵

首先，扩展公式（7）：
$\sum_{i=1}^{n} ||Rx_i-y_i||^2 = (Rx_i - y_i)^T(Rx_i-y_i)=(x_i^TR^T-y_i^T)(Rx_i-y_i)\\ = x_i^T R^T R x_i -y_i^TRx_i-x_i^T R^Ty_i + y_i^Ty_i \\ \overset{R^TR=I}{=}x_i^Tx_i -y_i^TRx_i -x_i^TR^Ty_i + y_i^Ty_i \tag{8}$
在公式（8)中，需要注意的是： $x_i^TR^Ty_i$ 是一个标量，因为在集合中的每个点 $x_i$ 是 $1\times d$ 维的矢量，旋转矩阵 $R$ 是一个 $d\times d$ 维度的矩阵， $y_i$ 是一个 $d\times 1$ 的矢量。
$\left[\right]_{1\times d}\left[\right]_{d\times d} \left[\right]_{d\times 1} = \left[\right]_{1\times 1}$
对任意的标量a，它满足 $a^T = a$ ，且在公式(8)中：
$x_i^T R^T y_i = (x_i^T R^Ty_i)^T=y_i^T R x_i$
所以公式(8)可以变成：
$||Rx_i-y_i||^2 =x_i^Tx_i -2y_i^TRx_i+y_i^Ty_i \tag{9}$
现在重新对公式(9)进行扩展，我们可以看出：
$argmin\sum_{i=1}^n w_i || Rx_i - y_i||^2 = argmin\sum_{i=1}^n w_i(x_i^Tx_i -2y_i^TRx_i+y_i^Ty_i) \\ =argmin(\sum_{i=1}^nw_ix_i^Tx_i - 2\sum_{i=1}^nw_iy_i^TRx_i+\sum_{i=1}^nw_iy_i^Ty_i)$
因为 $\sum_{i=1}^n w_i x_i^Tx_i$ 和 $\sum_{i=1}^{n} w_i y_i^T y_i$ 不依赖于旋转矩阵 $R$ ，所以
$argmin\sum_{i=1}^n w_i || Rx_i - y_i||^2 =argmin(-2 \sum_{i=1}^{n} w_i y_i^TRx_i) = argmax(\sum_{i=1}^{n} w_i y_i^TRx_i)$

另外，
$\sum_{i=1}^{n} w_i y_i^T R x_i = \left[ \begin{matrix}w_1 & & & \\ & w_2 & & \\ & & \ddots & \\ & & & w_n \end{matrix} \right] \left[ \begin{matrix} y_1^T \\ y_2^T \\ \vdots \\ y_n^T \end{matrix}\right] \left [ \begin{matrix} & & & \\ & R & \\ & & &\end{matrix}\right] \left[ \begin{matrix} x_1 & x_2 & \cdots & x_n \end{matrix} \right] \\ =\left[ \begin{matrix} w_1 y_1^T \\ w_2 y_2^T \\ \vdots \\ w_n y_n\end{matrix} \right] \left[ \begin{matrix} Rx_1 & Rx_2 & \cdots & Rx_n \end{matrix} \right] \\ = \left[ \begin{matrix} w_1y_1^TRx_1 & & & \\ & w_2y_2^TRx_2 & & \\ & & \ddots & \\ & & & w_ny_n^TRx_n \end{matrix} \right]$
所以，我们可以得到
$\sum_{i=1}^{n} w_i y_i^T R x_i =tr(WY^TRX)$
其中， $W =diag(w_1,...,w_n)$ ， $\left[ \begin{matrix} y_1 & y_2 & \cdots & y_n \end{matrix} \right]^T$ ， $\left[ \begin{matrix} x_1 & x_2 & \cdots & x_n \end{matrix} \right]$
且矩阵的迹满足某种特性，
$t r (A B) = t r (B A)$
则，
$\sum_{i=1}^{n} w_i y_i^T R x_i =tr(WY^TRX) = tr ((WY^T)(RX))=tr ((RX)(WY^T))=tr(RXWY^T)$
令 $S = XWY^T$
$\sum_{i=1}^{n} w_i y_i^T R x_i =tr(RXWY^T)\overset{S = XWY^T} {=}tr(RS)\overset{SVD}{=}tr(RU\Sigma V^T) =tr((\Sigma V^T) (RU))=tr(\Sigma V^T RU)$

需要注意的是： $V$ ， $R$ ， $U$ 是正交矩阵，所以 $M = V^T RU$ 同样也是正交矩阵。这也意味这在矩阵M中，每一列的向量 $m_j$ ， $m_j^T m_j = 1$ ，因此，
$tr(\Sigma M) = \left(\begin{matrix} \sigma_1 & & & \\ & \sigma_2 & & \\ & & \ddots & \\ & & & \sigma_d \end{matrix} \right) \left(\begin{matrix} m_{11} & m_{12} & \cdots & m_{1d} \\ m_{21} & m_{22} & \cdots & m_{2d} \\ \vdots & \vdots & \ddots & \vdots \\ m_{d1} & m_{d2} & \cdots & m_{dd} \end{matrix} \right) = \sum_{i=1}^{d} \sigma_i m_{ii} \leq \sum_{i=1}^{d} \sigma_i$
为了求得最大化的R， $argmax(\sum_{i=1}^{n} w_i y_i^TRx_i)$ ，则
$I = M = V^T RU \\ V = RU \\ R = VU^T$

计算出R之后，转移矩阵 $t$ 为：
$\hat q - R \hat p$

总结一下：

给定两个在d维空间中对应的点集合 $\{ p_1,p_2 ,\dots , p_n\}$ 和 $\{ q_1 ,q_2, \dots , q_n \}$ ,为了计算出它们之间的刚体变换，即 $R$ 和 $t$ ，其过程如下：

构建上述问题的模型为：
$\sum_{i=1}^n w_i||(Rp_i+t)-q_i||^2$
2.对两个点集合进行去中心化，得到新的点集合 $X$ 和 $Y$ ,表示为：
$\hat p = \frac{\sum_{i=1}^{n}w_ip_i}{\sum_{i=1}^{n}w_i} \\ \hat q = \frac{\sum_{i=1}^{n}w_iq_i}{\sum_{i=1}^{n}w_i} \\ x_i : = p_i-\hat p \\ y_i := q_i - \hat q$
此时，转移矩阵
$\hat q - R \hat p$
步骤一中的问题转化为：
$\text{argmin} \sum_{i=1}^{n} w_i ||Rx_i-y_i||^2 \\ = \text{argmax} \sum_{i=1}^n w_i y_i^T R x_i \\ =\text{argmax} ~ tr(WY^T R X) \\ = \text{argmax} ~tr(R X WY^T ) \\ =\text{argmax} ~ tr(R X WY^T) \\ \overset{SVD}{=}\text{argmax} ~tr(R U\Sigma V^T ) =\text{argmax} ~tr(\Sigma V^TR U )$
为了使得 $tr(\Sigma V^TR U )$ 达到最大值，
$I = V^TR U$
逐步化简：
$V = RU \\ R = VU^T$
所以， $t$ 可以根据公式 $\hat q - R \hat q$ 计算出来。
至此，就计算出两个点集合之间的选装矩阵 $R$ 和转移矩阵 $t$ 。另外，针对本章的推导，我写了一小段python代码验证了一下，有兴趣的可以看一下。计算两个对应点集之间的旋转矩阵R和转移矩阵T