二维平面成像模型(Models for transformations)(一)

最新推荐文章于 2021-05-13 04:27:39 发布

Fly_To_Sky666

最新推荐文章于 2021-05-13 04:27:39 发布

阅读量515

点赞数

分类专栏：计算机视觉中的多视图几何文章标签：计算机视觉机器学习算法线性代数

本文链接：https://blog.csdn.net/qq_40378982/article/details/109511784

版权

计算机视觉中的多视图几何专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1 2D转换模型

转换模型：transformation model

1.1 Euclidean transformation model

Euclidean transformation model描述场景中与像平面正面平行、距光心距离为 $D$ 的平面上的点与像平面对应点的数学关系。
首先假设世界坐标系的 $u$ - $v$ 平面与该平面重合，也即 $w$ 轴与之垂直，则该平面上的点可表示为 $w=[u,v,0]^T$ 。回想小孔成像的数学模型：
$\lambda \widetilde{x}=\Lambda[\Omega,\tau]\widetilde{w}\tag{1}$
应用此时的场景，便有：
$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&0&\tau_x\\\omega_{21}&\omega_{22}&0&\tau_y\\0&0&1&D \end{matrix} \right]\left[ \begin{matrix} u\\v\\0\\1 \end{matrix} \right]\\ =\left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\0&0&D \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\\ =\left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&D \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\0&0&1 \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{2}$
上式中由倒数第二行到最后一行的变化为将距离 $D$ 移到了 $\Lambda$ 中，注意这样处理有利于后续的处理而且并不改变计算结果。之后我们再等式两边同时左乘 $\Lambda^{-1}$ 可得到：
$\lambda \left[ \begin{matrix} x'\\y'\\1 \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\0&0&1 \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{3}$
上式便是Euclidean transformation. 还可表示为：
$\left[ \begin{matrix} x'\\y' \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}\\\omega_{21}&\omega_{22} \end{matrix} \right]\left[ \begin{matrix} u\\v \end{matrix} \right]+\left[ \begin{matrix} \tau_x\\\tau_y \end{matrix} \right]\tag{4}$
或者简记为：
$x'=euc[w,\Omega,\tau]\tag{5}$
注意，Euclidean transformation只能刚性旋转和平移，虽然它表面上有6个未知参数，实际上只有3个参数(旋转角度 $\theta$ 、平移参数 $\tau_x$ 和 $\tau_y$ )， $\Omega$ 可表示为：
$\left[ \begin{matrix} \omega_{11}&\omega_{12}\\\omega_{21}&\omega_{22} \end{matrix} \right]=\left[ \begin{matrix} \cos{\theta}&\sin{\theta}\\-\sin{\theta}&\cos{\theta} \end{matrix} \right]\tag{6}$

1.2 Similarity transformation model

Similarity transformation model描述场景中与像平面正面平行、到光心距离未知的平面上的点与像平面对应点的数学关系。此时平面上坐标点 $w=[u,v]^T$ 和对应投影点 $x=[x,y]^T$ 的关系为：
$\lambda \left[ \begin{matrix} x'\\y'\\1 \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\0&0&D \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{7}$
等式两边同时乘以 $\rho=1/D$ 得：
$\rho\lambda \left[ \begin{matrix} x'\\y'\\1 \end{matrix} \right]= \left[ \begin{matrix} \rho\omega_{11}&\rho\omega_{12}&\rho\tau_x\\\rho\omega_{21}&\rho\omega_{22}&\rho\tau_y\\0&0&1 \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{8}$
再把 $\lambda$ 、 $\tau_x$ 和 $\tau_y$ 前面的 $\rho$ 并入可得：
$\lambda \left[ \begin{matrix} x'\\y'\\1 \end{matrix} \right]= \left[ \begin{matrix} \rho\omega_{11}&\rho\omega_{12}&\tau_x\\\rho\omega_{21}&\rho\omega_{22}&\tau_y\\0&0&1 \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{9}$
上式便是Similarity transformation. 还可表示为：
$\left[ \begin{matrix} x'\\y' \end{matrix} \right]= \left[ \begin{matrix} \rho\omega_{11}&\rho\omega_{12}\\\rho\omega_{21}&\rho\omega_{22} \end{matrix} \right]\left[ \begin{matrix} u\\v \end{matrix} \right]+\left[ \begin{matrix} \tau_x\\\tau_y \end{matrix} \right]\tag{10}$
或者简记为：
$x'=sim[w,\Omega,\tau,\rho]\tag{11}$
注意，Similarity transformation只能刚性旋转、平移和缩放，它比Euclidean transformation多了一个参数 $\rho$ 。

1.3 Affine transformation model

Affine transformation model被希望(后面将会看到这不可行)用来描述场景中任意位置的平面上的点与像平面对应点的数学关系：
$\lambda \left[ \begin{matrix} x'\\y'\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}&\tau_x\\\phi_{21}&\phi_{22}&\tau_y\\0&0&1 \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{12}$
上式便是Affine transformation. 还可表示为：
$\left[ \begin{matrix} x'\\y' \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}\\\phi_{21}&\phi_{22} \end{matrix} \right]\left[ \begin{matrix} u\\v \end{matrix} \right]+\left[ \begin{matrix} \tau_x\\\tau_y \end{matrix} \right]\tag{13}$
或者简记为：
$x'=aff[w,\Phi,\tau]\tag{14}$
注意，由于相机内部参数矩阵 $\Lambda$ 也是一个仿射矩阵(最后一行前两个元素为0)，而两个仿射矩阵的乘积仍然是一个仿射矩阵，所以可以用仿射变换来直接描述像平面上点和场景中平面上对应点的数学关系。
注意，仿射变换适用的条件为：场景中平面的深度变换比其到相机的平均距离小。这种情况一般表现为观察角度不是很倾斜、相机距离平面较远而且视角相对较小。除此以外的情况不适合用仿射变换来描述，这是因为仿射变换属于线性变换，线性变换的特点之一是平行的线变换后仍保持平行；而实际生活中，例如我们观察较远处的火车轨道时，它往往表现为将要交汇于某一点。

1.4 Projective transformation model

透视变换可以描述从任意角度、任意距离观察任意大小物体时的坐标变化关系。此时，场景中平面上的点 $w=[u,v,0]^T$ 和与之对应的像平面上的投影点的关系为：
$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}&\tau_x\\\omega_{21}&\omega_{22}&\omega_{23}&\tau_y\\\omega_{31}&\omega_{32}&\omega_{33}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u\\v\\0\\1 \end{matrix} \right]\\ =\left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\\omega_{31}&\omega_{32}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{15}$
将两个 $3\times 3$ 的矩阵相乘可得：
$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{16}$
上式便是透视变换(projective transformation)，还被称为单应变换(homography). 在笛卡尔坐标系下表示为：
$x=\frac{\phi_{11}u+\phi_{12}v+\phi_{13}}{\phi_{31}u+\phi_{32}v+\phi_{33}}\\ y=\frac{\phi_{21}u+\phi_{22}v+\phi_{23}}{\phi_{31}u+\phi_{32}v+\phi_{33}}\tag{17}$
或者简记为：
$x=hom[w,\Phi]\tag{18}$
注意，透视变换可以将平面上一个四边形变化为任意形状的四边形。而且虽然矩阵 $\Phi$ 中有9个未知参数，实际上它只有8个自由度。

2 转换模型参数的学习

实际应用中，场景平面成像过程中容易受到各种噪声的影响，因此成像点坐标带有不确定性，因此我们考虑用概率模型进一步描述。对于透视投影(Homography)，概率模型为：
$Pr(x|w)=Norm_x[hom[w,\Phi],\delta^2I]\tag{19}$

2.1 问题描述

已知场景中2D平面上 $I$ 个不同的2D坐标点 $w_i=[u_i,v_i]^T$ 以及与之对应的图像平面2D投影点 $x_i=[x_i,y_i]^T$ ，对于给定的转换模型 $trans[w_i,\theta]$ ，求解模型的参数 $\theta$ 。应用极大似然法可得：
$\widehat{\theta}={\underset {\theta}{\operatorname {argmax} }}\,\Bigg[\prod_{i=1}^I Norm_x[trans[w,\theta],\delta^2I]\Bigg]\\ ={\underset {\theta}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Norm_x[trans[w,\theta],\delta^2I]]\Bigg]\\ ={\underset {\theta}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-trans[w_i,\theta])^T(x_i-trans[w_i,\theta]) \Bigg]\tag{20}$

2.2 学习Euclidean参数

Enclidean transformation的参数包括一个 $2\times 2$ 的旋转矩阵 $\Omega$ 和一个 $2\times 1$ 的位移向量 $\tau=[\tau_x,\tau_y]^T$ 。所以问题变为：
$\widehat{\Omega},\widehat{\tau} ={\underset {\Omega,\tau}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-euc[w_i,\Omega,\tau])^T(x_i-euc[w_i,\Omega,\tau]) \Bigg]\\ ={\underset {\Omega,\tau}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-\Omega w_i-\tau)^T(x_i-\Omega w_i-\tau) \Bigg] \tag{21}$
将目标函数对 $\tau$ 求导并等于零可以求解得到：
$\widehat{\tau} =\frac{\sum_{i=1}^I x_i-\Omega w_i}{I}=\mu_x-\Omega\mu_w \tag{22}$
代入式(21)可得：
$\widehat{\Omega} ={\underset {\Omega}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I ((x_i-\mu_x)-\Omega (w_i-\mu_w))^T((x_i-\mu_x)-\Omega (w_i-\mu_w)) \Bigg] \tag{23}$
定义矩阵 $B=[x_1-\mu_x,x_2-\mu_x,\cdots,x_I-\mu_x]$ 和矩阵 $A=[w_1-\mu_w,w_2-\mu_w,\cdots,w_I-\mu_w]$ ，此时问题转化为如下的Orthogonal Procrustes Problem：
$\hat \Omega={\underset {\Omega}{\operatorname {argmin} }}\,[|\Omega A-B|_F]\tag{24}$
问题的解为：
$BA^T=ULV^T\\ \widehat{\Omega}=UV^T\tag{25}$

2.3 学习Similarity参数

Similarity transformation的参数包括一个 $2\times 2$ 的旋转矩阵 $\Omega$ 、一个 $2\times 1$ 的位移向量 $\tau=[\tau_x,\tau_y]^T$ 和一个标量 $\rho$ 。所以问题变为：
$\widehat{\Omega},\widehat{\tau},\widehat{\rho} ={\underset {\Omega,\tau,\rho}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-sim[w_i,\Omega,\tau,\rho])^T(x_i-sim[w_i,\Omega,\tau,\rho]) \Bigg]\\ ={\underset {\Omega,\tau}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-\rho\Omega w_i-\tau)^T(x_i-\rho\Omega w_i-\tau) \Bigg] \tag{26}$
和2.2一样可以求解得到 $\widehat{\Omega}$ ;
代入可得 $\widehat{\rho}$ 和 $\widehat{\tau}$ 为：
$\widehat{\rho}=\frac{\sum_{i=1}^I (x_i-\mu_x)^T\widehat{\Omega}(w_i-\mu_w)}{\sum_{i=1}^I (w_i-\mu_w)^T(w_i-\mu_w)}\\ \widehat{\tau}=\frac{\sum_{i=1}^I (x_i-\widehat{\rho}\widehat{\Omega} w_i)}{I}=\mu_x-\Omega\mu_w \tag{27}$

2.4 学习Affine参数

Affine transformation的参数包括一个 $2\times 2$ 的旋转矩阵 $\Omega$ 、一个 $2\times 1$ 的位移向量 $\tau=[\tau_x,\tau_y]^T$ 。所以问题变为：
$\widehat{\Phi},\widehat{\tau} ={\underset {\Phi,\tau}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-aff[w_i,\Phi,\tau])^T(x_i-aff[w_i,\Phi,\tau]) \Bigg]\\ ={\underset {\Omega,\tau}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-\Phi w_i-\tau)^T(x_i-\Phi w_i-\tau) \Bigg] \tag{28}$
我们对 $\Phi w_i+\tau$ 做如下处理：
$\Phi w_i+\tau= \left[ \begin{matrix} u_i&v_i&1&0&0&0\\ 0&0&0&u_i&v_i&1 \end{matrix} \right] \left[ \begin{matrix} \phi_{11}\\\phi_{12}\\\tau_x\\\phi_{21}\\\phi_{22}\\\tau_y \end{matrix} \right]=A_ib\tag{29}$
这样，式(28)变为：
$\widehat{b} ={\underset {b}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-A_ib)^T(x_i-A_ib) \Bigg] \tag{30}$
这样便可以按照Least squares problem求解。

2.5 学习Projective参数

Projective transformation的参数包括一个 $3\times 3$ 的矩阵 $\Phi$ ，因此问题变为：
$\widehat{\Phi} ={\underset {\Phi}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-hom[w_i,\Phi])^T(x_i-hom[w_i,\Phi]) \Bigg]\\ ={\underset {\Phi}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x_i-\frac{\phi_{11}u_i+\phi_{12}v_i+\phi_{13}}{\phi_{31}u_i+\phi_{32}v_i+\phi_{33}})^2+(y_i-\frac{\phi_{21}u_i+\phi_{22}v_i+\phi_{23}}{\phi_{31}u_i+\phi_{32}v_i+\phi_{33}})^2 \Bigg] \tag{31}$
这个问题没有封闭解，只能应用基于梯度的非线性优化求解方法。像之前一样，我们可以求得一个合适的初始解。在齐次坐标表示下：
$\lambda \left[ \begin{matrix} x_i\\y_i\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]\left[ \begin{matrix} u_i\\v_i\\1 \end{matrix} \right]\tag{32}$
每个齐次坐标表示一条通过光心的直线，因此上式表明等号左边的向量与等号右边的向量相等，也即同方向，因此有：
$\widetilde{x}\times \Phi\widetilde{w}=0\tag{33}$
展开后可以得到：
$\left[ \begin{matrix} y(\phi_{31}u+\phi_{32}v+\phi_{33})-(\phi_{21}u+\phi_{22}v+\phi_{23})\\ (\phi_{11}u+\phi_{12}v+\phi_{13})-x(\phi_{31}u+\phi_{32}v+\phi_{33})\\ x(\phi_{21}u+\phi_{22}v+\phi_{23})-y(\phi_{11}u+\phi_{12}v+\phi_{13}) \end{matrix} \right]=0$
将 $I$ 个点对应的等式全部整合为下式：
$\left[ \begin{matrix} 0&0&0&-u_1&-v_1&-1&u_1y_1&v_1y_1&y_1\\ u_1&v_1&1&0&0&0&-u_1x_1&-v_1x_1&-x_1\\ 0&0&0&-u_2&-v_2&-1&u_2y_2&v_2y_2&y_2\\ u_2&v_2&1&0&0&0&-u_2x_2&-v_2x_2&-x_2\\ \vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots\\ 0&0&0&-u_I&-v_I&-1&u_Iy_I&v_Iy_I&y_I\\ u_I&v_I&1&0&0&0&-u_Ix_I&-v_Ix_I&-x_I\\ \end{matrix} \right]\left[\begin{matrix} \phi_{11}\\\phi_{12}\\\phi_{13}\\\phi_{21}\\\phi_{22}\\\phi_{23}\\\phi_{31}\\\phi_{32}\\\phi_{33}\\ \end{matrix} \right]=0\tag{34}$
此时，问题就变为形如 $A b = 0$ 的minimum direction problem (请阅读参考资料)，即求解奇异值分解 $A=ULV^T$ 并且设 $\hat{b}$ 为 $V$ 的最后一列。

3 利用转换模型进行推理

已知一个转换模型 $trans[w,\theta]$ 和像平面上的一个点 $x=[x,y]^T$ ，求解场景中平面上的对应点：
$\widehat{w}={\underset {w}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Norm_x[trans[w,\theta],\delta^2I]]\Bigg]\\ ={\underset {w}{\operatorname {argmin} }}\,\Bigg[\sum_{i=1}^I (x-trans[w,\theta])^T(x-trans[w,\theta]) \Bigg]\tag{35}$
$x=trans[w,\theta]\tag{36}$
$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]\tag{37}$
$\lambda' \left[ \begin{matrix} u\\v\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]^{-1}\left[ \begin{matrix} x\\y\\1 \end{matrix} \right]\tag{38}$

4 学习外部参数

已知场景中平面上 $I$ 个不同的3D坐标点 ${w_i\}_{i=1}^I$ (假设 $w_i=0$ )，与之对应的图像平面2D投影点 ${x_i\}_{i=1}^I$ 和内部参数 $\Lambda$ ，求解外部参数 $\{\Omega,\tau\}$ ：
$\widehat{\Omega},\,\widehat{\tau}={\underset {\Omega,\,\tau}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Pr(x_i|w_i,\Lambda,\Omega,\tau)]\Bigg]\\ ={\underset{\Omega,\,\tau}{\operatorname{argmax}}}\Bigg[\sum_{i=1}^I \log\big[Norm_{x_i}[pinhole[w_i,\Lambda,\Omega,\tau],\sigma^2I]\big]\Bigg]\tag{39}$
和之前的情况一样，这个问题仍然没有解析解，但可以在齐次坐标的表示下求得一个合适的初始解：
$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]=\lambda' \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\\omega_{31}&\omega_{32}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right]=\left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]\left[ \begin{matrix} u\\v\\1 \end{matrix} \right] \tag{40}$
在2.5节中我们已经学习了如何求解homography $\Phi$ ，所以接下来我们只需要根据式(40)拆分矩阵 $\Phi$ 来获得旋转矩阵 $\Omega$ 和位移矩阵 $\tau$ 。具体为首先式(40)后两项左乘 $\Lambda^{-1}$ 以消除内部参数的影响，可得：
$\Phi'=\Lambda^{-1}\Phi= \lambda' \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\\omega_{31}&\omega_{32}&\tau_z \end{matrix} \right]=\left[ \begin{matrix} \phi_{11}'&\phi_{12'}&\phi_{13}'\\\phi_{21}'&\phi_{22}'&\phi_{23}'\\\phi_{31}'&\phi_{32}'&\phi_{33}' \end{matrix} \right]\tag{41}$
接下来估计旋转矩阵 $\Omega$ 中的前两列(这里的求解方法和Orthogonal Procrustes Problem类似)：
$\left[ \begin{matrix} \phi_{11}'&\phi_{12'}\\\phi_{21}'&\phi_{22}'\\\phi_{31}'&\phi_{32}' \end{matrix} \right]=ULV^T\\ \left[ \begin{matrix} \omega_{11}&\omega_{12}\\\omega_{21}&\omega_{22}\\\omega_{31}&\omega_{32} \end{matrix} \right]=U\left[ \begin{matrix} 1&0\\0&1\\0&0 \end{matrix} \right]V^T\tag{42}$
为了求出旋转矩阵最后一列，我们只需要求前两列的叉积(旋转矩阵是正交矩阵)，并保证最终的旋转矩阵行列式等于1.式(41)中的标量 $\lambda'$ 可以按下式求解：
$\lambda'=\frac{\sum_{m=1}^3\sum_{n=1}^2 \phi_{mn}'/w_{mn}}{6}\tag{43}$
最后，位移矩阵为：
$\tau=[\phi_{13}',\phi_{23}',\phi_{33}']^T/\lambda'\tag{44}$

5 学习内部参数

如果希望利用场景中一个平面上的点去标定相机，需要相机在多个位姿下对平面成像。基于此，此处的相机标定问题的描述为：已知场景中某个平面上 $I$ 个不同的3D坐标点 ${w_i\}_{i=1}^I$ 和与之对应的 $J$ 个不同位姿下的图像平面2D投影点 ${x_i\}_{i=1,j=1}^{I,J}$ ，利用最大似然方法求解内部参数 $\{\Omega,\tau\}$ ：
$\widehat{\Lambda}={\underset{\Lambda}{\operatorname{argmax}}}\Bigg[{\underset {\Omega_{1...J},\tau_{1...J}}{\operatorname {max} }}\,\Bigg[\sum_{i=1}^I \sum_{j=1}^J \log[Pr(x_{ij}|w_i,\Lambda,\Omega_j,\tau_j)]\Bigg]\Bigg]\tag{45}$
和之前一样，这里介绍的方法采用了Coordinate ascent method，即迭代执行下面两步：

求解相机 $J$ 个位姿下的外部参数：
$\widehat{\Omega}_j,\,\widehat{\tau}_j={\underset {\Omega_j,\,\tau_j}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Pr(x_{ij}|w_i,\Lambda,\Omega_j,\tau_j)]\Bigg]\tag{46}$
求解当前迭代步中的内部参数：
$\widehat{\Lambda}={\underset{\Lambda}{\operatorname{argmax}}}\,\Bigg[\sum_{i=1}^I \sum_{j=1}^J \log[Pr(x_{ij}|w_i,\Lambda,\Omega_j,\tau_j)]\Bigg]\tag{47}$
类似的，该方法的效率也很低，实际应用中还有更好的方法。

6 推理3D坐标点

已知一个(注意：由于此处一一对应的关系，只需要一个相机便能推理)标定好并且已知位姿的相机(也即已知 $\Lambda, \Omega, \tau$ )和场景中某个平面上一个未知3D坐标点 $w=[u,v,0]^T$ 在相机上的2D投影点坐标 $x$ ，求该3D坐标点的位置：
$T=\left[ \begin{matrix} \phi_{11}&\phi_{12}&\phi_{13}\\\phi_{21}&\phi_{22}&\phi_{23}\\\phi_{31}&\phi_{32}&\phi_{33} \end{matrix} \right]=\left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\tau_x\\\omega_{21}&\omega_{22}&\tau_y\\\omega_{31}&\omega_{32}&\tau_z \end{matrix} \right]\tag{48}$
在世界坐标系下为：
$\widetilde{w}=T^{-1}\widetilde{x}\tag{49}$
转换到相机坐标系下为：
$w'=\Omega w+\tau\tag{50}$

Fly_To_Sky666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
二维平面成像模型(Models for transformations)(一)

目录1 2D转换模型1.1 Euclidean transformation model1.2 Similarity transformation model1.3 Affine transformation model1.4 Projective transformation model2 转换模型参数的学习2.1 问题描述2.2 学习Euclidean参数2.3 学习Similarity参数2.4 学习Affine参数2.5 学习Projective参数3 利用转换模型进行推理4 学习外部参数5 学习内
复制链接

扫一扫

专栏目录