针孔相机(The pinhole camera)

Fly_To_Sky666

于 2020-11-03 16:23:14 发布

阅读量1.5k

点赞数 2

分类专栏：计算机视觉中的多视图几何文章标签：计算机视觉深度学习线性代数机器学习

本文链接：https://blog.csdn.net/qq_40378982/article/details/109461575

版权

计算机视觉中的多视图几何专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1 小孔成像

针孔相机是一个描述真实世界中3D坐标点和图像平面上对应2D坐标点关系的纯几何模型。如下图所示：
在这里插入图片描述
图中，我们假设世界坐标系和相机坐标系重合。这里还有几个专有名词：

光心(Optical center)
像平面(Image plane)
焦距(Focal length)
光轴(Optical axis)
主点(Principal point)
接下来,我们就要建立描述真实世界3D坐标点 $u,v,w]^T$ 和它在像平面上投影点 $x,y]^T$ 数学关系的模型。建模的原理很简单，只需要用到初中学的相似三角形。

1.1 The normalized camera

在标准相机(The normalized camera)模型里，有三个限制条件：

焦距为1；
相机坐标系和世界坐标系重合；
2D图像坐标系的原点和主点重合；
直接上公式：
$x=\frac {u}{w}\\ y=\frac {v}{w} \tag{1}$

1.2 Focal length parameters

标准相机模型的限制条件太多，实际意义不大。在真实的相机中，首先，焦距没有必要一定要设为1；其次，2D图像坐标系中是以像素为单位进行测量的，具有离散化的特点。所以引入了 $x$ 和 $y$ 轴方向上的焦长参数 $\phi_x$ 和 $\phi_y$ ，注意，这两个参数分别考虑了对应坐标轴方向上感光元件的间距和焦距。待入模型得：
$x=\frac {\phi_xu}{w}\\ y=\frac {\phi_yv}{w} \tag{2}$

1.3 Offset and skew parameters

进一步减少限制条件，在真实世界中，图像坐标系的原点一般位于像平面的左上角，因此引入 $x$ 和 $y$ 轴方向的偏置参数 $\delta_x$ 和 $\delta_y$ ，代入模型得：
$x=\frac {\phi_xu}{w}+\delta_x\\ y=\frac {\phi_yv}{w}+\delta_y \tag{3}$
根据实际经验，我们还需要引入一个参数 $\gamma$ ，这个参数没有实际的物理意义，却可以使得模型更加精确。代入模型得：
$x=\frac {\phi_xu+\gamma v}{w}+\delta_x\\ y=\frac {\phi_yv}{w}+\delta_y \tag{4}$

1.4 Position and orientation of camera

最后，为了定义任意的世界坐标系，需要引入场景中3D坐标点在世界坐标系和相机坐标系的转换：
$\left[ \begin{matrix} u'\\v'\\w' \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}\\\omega_{21}&\omega_{22}&\omega_{23}\\\omega_{31}&\omega_{32}&\omega_{33} \end{matrix} \right] \left[ \begin{matrix} u\\v\\w \end{matrix} \right]+ \left[ \begin{matrix} \tau_x\\\tau_y\\\tau_z \end{matrix} \right] \tag{5}$
简写为：
$w'=\Omega w+\tau \tag{6}$

1.5 Full pinhole camera model

结合式(4)和(5)可得完整的3D世界坐标点 $u,v,w]^T$ 到2D图像坐标点 $x,y]^T$ 的数学关系为：
$x=\frac {\phi_x(\omega_{11}u+\omega_{12}v+\omega_{13}w+\tau_x)+\gamma(\omega_{21}u+\omega_{22}v+\omega_{23}w+\tau_y)}{\omega_{31}u+\omega_{32}v+\omega_{33}w+\tau_z}+\delta_x\\ y=\frac {\phi_y(\omega_{21}u+\omega_{22}v+\omega_{23}w+\tau_y)}{\omega_{31}u+\omega_{32}v+\omega_{33}w+\tau_z}+\delta_y \tag{7}$
内部参数(intrinsic parameters)： $\{\phi_x,\phi_y,\gamma,\delta_x,\delta_y\}$ ，也用矩阵形式表达为：
$\Lambda= \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right]\tag{8}$
外部参数(extrinsic parameters)： $\{\Omega,\tau\}$
最终的相机模型可简化为：
$x=pinhole[w,\Lambda,\Omega,\tau]\tag{9}$
概率形式为：
$Pr[x|w,\Lambda,\Omega,\tau]=Norm_x[pinhole[w,\Lambda,\Omega,\tau],\delta^2I]\tag{10}$

2 齐次坐标系

引入齐次坐标系的目的是将式(7)的非线性关系式转化为线性关系式。
2D坐标点齐次坐标：
$\widetilde{x}=\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]\tag{11}$
2D坐标点的笛卡尔坐标到齐次坐标的转换只需要在向量后增加一个元素1，齐次坐标到笛卡尔坐标的转换只需要前两个元素除以最后一个元素。
3D坐标点齐次坐标：
$\widetilde{w}=\lambda \left[ \begin{matrix} u\\v\\w\\1 \end{matrix} \right]\tag{12}$
3D坐标点的笛卡尔坐标到齐次坐标的转换只需要在向量后增加一个元素1，齐次坐标到笛卡尔坐标的转换只需要前两个元素除以最后一个元素。

2.1 齐次坐标下的相机模型

$\lambda \left[ \begin{matrix} x\\y\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}&\tau_x\\\omega_{21}&\omega_{22}&\omega_{23}&\tau_y\\\omega_{31}&\omega_{32}&\omega_{33}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u\\v\\w\\1 \end{matrix} \right]\tag{13}$
或者简记为：
$\lambda \widetilde{x}=\Lambda[\Omega\,\,\,\tau]\widetilde{w}\tag{14}$

3 学习外部参数

Perspective-n-point(PnP)

3.1 问题描述

已知场景中 $I$ 个不同的三D坐标点 ${w_i\}_{i=1}^I$ ，与之对应的图像平面2D投影点 ${x_i\}_{i=1}^I$ 和内部参数 $\Lambda$ ，求解外部参数 $\{\Omega,\tau\}$ ：
$\widehat{\Omega},\,\widehat{\tau}={\underset {\Omega,\,\tau}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Pr(x_i|w_i,\Lambda,\Omega,\tau)]\Bigg]\tag{15}$

3.2 求解过程

该优化问题是非凸问题，我们不能得到目标函数的封闭解，所以只能用非线性优化求解。而非线性优化求解需要一个初始值，而这个初始值的挑选非常关键，它必须保证迭代过程最后收敛到全局最优解。所以我们用齐次坐标重新表示目标函数以求得一个满足要求的封闭形式的初始解。
第 $I$ 个齐次3D坐标点和对应的2D图像投影点的关系为：
$\lambda_i \left[ \begin{matrix} x_i\\y_i\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_x&\gamma&\delta_x\\0&\phi_y&\delta_y\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}&\tau_x\\\omega_{21}&\omega_{22}&\omega_{23}&\tau_y\\\omega_{31}&\omega_{32}&\omega_{33}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u_i\\v_i\\w_i\\1 \end{matrix} \right]\tag{16}$
式(16)等号两边同时左乘 $\Lambda^{-1}$ 得：
$\lambda_i \left[ \begin{matrix} x_i'\\y_i'\\1 \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}&\tau_x\\\omega_{21}&\omega_{22}&\omega_{23}&\tau_y\\\omega_{31}&\omega_{32}&\omega_{33}&\tau_z \end{matrix} \right]\left[ \begin{matrix} u_i\\v_i\\w_i\\1 \end{matrix} \right]\tag{17}$
消去 $\lambda_i$ 得：
$\left[ \begin{matrix} (\omega_{31}u_i+\omega_{32}v_i+\omega_{33}w_i+\tau_z)x_i'\\ (\omega_{31}u_i+\omega_{32}v_i+\omega_{33}w_i+\tau_z)y_i' \end{matrix} \right]= \left[ \begin{matrix} \omega_{11}&\omega_{12}&\omega_{13}&\tau_x\\\omega_{21}&\omega_{22}&\omega_{23}&\tau_y \end{matrix} \right]\left[ \begin{matrix} u_i\\v_i\\w_i\\1 \end{matrix} \right]\tag{18}$
将 $I$ 个点对应的等式全部整合为下式：
$\left[ \begin{matrix} u_1&v_1&w_1&1&0&0&0&0&-u_1x_1'&-v_1x_1'&-w_1x_1'&-x_1'\\ 0&0&0&0&u_1&v_1&w_1&1&-u_1y_1'&-v_1y_1'&-w_1y_1'&-y_1'\\ u_2&v_2&w_2&1&0&0&0&0&-u_2x_2'&-v_2x_2'&-w_2x_2'&-x_2'\\ 0&0&0&0&u_2&v_2&w_2&1&-u_2y_2'&-v_2y_2'&-w_2y_2'&-y_2'\\ \vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots&\vdots\\ u_I&v_I&w_I&1&0&0&0&0&-u_Ix_I'&-v_Ix_I'&-w_Ix_I'&-x_I'\\ 0&0&0&0&u_I&v_I&w_I&1&-u_Iy_I'&-v_Iy_I'&-w_Iy_I'&-y_I'\\ \end{matrix} \right]\left[\begin{matrix} \omega_{11}\\\omega_{12}\\\omega_{13}\\\tau_x\\\omega_{21}\\\omega_{22}\\\omega_{23}\\\tau_y\\\omega_{31}\\\omega_{32}\\\omega_{33}\\\tau_z \end{matrix} \right]=0\tag{19}$
此时，问题就变为形如 $A b = 0$ 的minimum direction problem (请阅读参考资料)，即求解奇异值分解 $A=ULV^T$ 并且设 $\hat{b}$ 为 $V$ 的最后一列。但是从 $\hat{b}$ 提取得到的旋转矩阵 $\Omega$ 和平移向量 $\tau$ 与真实值有个未知标量的差别，所以还需要进一步求解：
首先求出最接近的旋转矩阵，问题形如 $\hat \Omega={\underset {\Omega'}{\operatorname {argmin} }}\,[\Omega'-\Omega]$ ,此时就可以参照Orthogonal Procrustes problem求解(请阅读参考资料)，具体为求奇异值分解 $\Omega=ULV^T$ 并且设 $\widehat{\Omega}$ 为 $UV^T$ 。
最后再按照下式求解 $\widehat{\tau}$ :
$\widehat{\tau}=\sum_{m=1}^3\sum_{n=1}^3 \frac{\widehat{\Omega}_{mn}}{\Omega_{mn}}\tau\tag{20}$

4 学习内部参数

Camera Calibration

4.1 问题描述

已知场景中 $I$ 个不同的三D坐标点 ${w_i\}_{i=1}^I$ 和与之对应的图像平面2D投影点 ${x_i\}_{i=1}^I$ ，利用最大似然方法求解内部参数 $\{\Omega,\tau\}$ ：
$\widehat{\Lambda}={\underset{\Lambda}{\operatorname{argmax}}}\Bigg[{\underset {\Omega,\,\tau}{\operatorname {max} }}\,\Bigg[\sum_{i=1}^I\log[Pr[x_i|w_i,\Lambda,\Omega,\tau]\Bigg]\Bigg]\tag{21}$

4.2 求解过程

由于内部参数和外部参数都为未知，所以一个简单(但效率很差)的方法是coordinate ascent method。该方法交替迭代下述两个过程：

更新内部参数(已知)，求解外部参数：
$\widehat{\Omega},\,\widehat{\tau}={\underset {\Omega,\,\tau}{\operatorname {argmax} }}\,\Bigg[\sum_{i=1}^I\log[Pr(x_i|w_i,\Lambda,\Omega,\tau)]\Bigg]\tag{22}$
更新外部参数(已知)，求解内部参数：
$\widehat{\Lambda}={\underset{\Lambda}{\operatorname{argmax}}}\Bigg[\sum_{i=1}^I\log[Pr(x_i|w_i,\Lambda,\Omega,\tau)]\Bigg]\tag{23}$
由于第一步在第三节已经介绍过，所以接下来介绍第二步的解法。幸运的是，第二个问题有封闭解(不需要齐次表示)。重新描述问题为：
已知场景中 $I$ 个不同的三D坐标点 ${w_i\}_{i=1}^I$ ，与之对应的图像平面2D投影点 ${x_i\}_{i=1}^I$ 和外部参数 $\{\Omega,\tau\}$ ，求解内部参数 $\Lambda$ ：
$\widehat{\Lambda}={\underset{\Lambda}{\operatorname{argmax}}}\Bigg[\sum_{i=1}^I \log\big[Norm_{x_i}[pinhole[w_i,\Lambda,\Omega,\tau],\sigma^2I]\big]\Bigg]\\ ={\underset{\Lambda}{\operatorname{argmin}}}\Bigg[\sum_{i=1}^I (x_i-pinhole[w_i,\Lambda,\Omega,\tau])^T(x_i-pinhole[w_i,\Lambda,\Omega,\tau])\Bigg]\tag{24}$
很明显，此时问题转化为一个Least squares problem(请阅读参考资料):
$A_i= \left[ \begin{matrix} \frac{\omega_{11}u_i+\omega_{12}v_i+\omega_{13}w_i+\tau_z}{\omega_{31}u_i+\omega_{32}v_i+\omega_{33}w_i+\tau_z} &\frac{\omega_{21}u_i+\omega_{22}v_i+\omega_{23}w_i+\tau_y}{\omega_{31}u_i+\omega_{32}v_i+\omega_{33}w_i+\tau_z} & 1 & 0 & 0\\ 0&0&0&\frac{\omega_{21}u_i+\omega_{22}v_i+\omega_{23}w_i+\tau_y}{\omega_{31}u_i+\omega_{32}v_i+\omega_{33}w_i+\tau_z}&1 \end{matrix} \right]\\ h=[\phi_x,\gamma,\delta_x,\phi_y,\delta_y]^T$
最后需要注意的是，这个求解方法实际中应用很少，因为它收敛速度非常慢。实际中一般采用该方法迭代几次，然后直接采用非线性优化方法同时优化内部参数和外部参数。

5 推理三维坐标点

Calibrated stereo reconstruction (Two calibrated cameras)
Multi-view reconstruction (Three or more calibrated cameras)

5.1 问题描述

已知 $J$ 个标定好并且已知位姿的相机(也即已知 $\Lambda_j, \Omega_j, \tau_j$ )和场景中某个未知的三维坐标点 $w$ 在每个相机上的2D投影点坐标 ${x_j\}_{j=1}^J$ ，求该3D坐标点的位置：
$\widehat{w}={\underset{w}{\operatorname{argmax}}}\Bigg[\sum_{j=1}^J\log[Pr(x_j|w_j,\Lambda_j,\Omega_j,\tau_j)]\Bigg]\tag{26}$

5.2 求解过程

本问题同样没有封闭解，所以我们需要借助齐次坐标重新表示以求得一个合适的初始解。
3D齐次坐标点和第 $j$ 个相机中的2D齐次坐标的关系为：
$\lambda_j \left[ \begin{matrix} x_j\\y_j\\1 \end{matrix} \right]= \left[ \begin{matrix} \phi_{xj}&\gamma_j&\delta_{xj}\\0&\phi_{yj}&\delta_{yj}\\0&0&1 \end{matrix} \right] \left[ \begin{matrix} \omega_{11j}&\omega_{12j}&\omega_{13j}&\tau_{xj}\\\omega_{21j}&\omega_{22j}&\omega_{23j}&\tau_{yj}\\\omega_{31j}&\omega_{32j}&\omega_{33j}&\tau_{zj} \end{matrix} \right]\left[ \begin{matrix} u\\v\\w\\1 \end{matrix} \right]\tag{27}$
式(27)等号两边同时左乘 $\Lambda_j^{-1}$ 得：
$\lambda_j \left[ \begin{matrix} x_j'\\y_j'\\1 \end{matrix} \right]= \left[ \begin{matrix} \omega_{11j}&\omega_{12j}&\omega_{13j}&\tau_{xj}\\\omega_{21j}&\omega_{22j}&\omega_{23j}&\tau_{yj}\\\omega_{31j}&\omega_{32j}&\omega_{33j}&\tau_{zj} \end{matrix} \right]\left[ \begin{matrix} u\\v\\w\\1 \end{matrix} \right]\tag{28}$
消去 $\lambda_j$ 得：
$\left[ \begin{matrix} (\omega_{31}u+\omega_{32}v+\omega_{33}w+\tau_z)x_j'\\ (\omega_{31}u+\omega_{32}v+\omega_{33}w+\tau_z)y_j' \end{matrix} \right]= \left[ \begin{matrix} \omega_{11j}&\omega_{12j}&\omega_{13j}&\tau_{xj}\\\omega_{21j}&\omega_{22j}&\omega_{23j}&\tau_{yj} \end{matrix} \right]\left[ \begin{matrix} u\\v\\w\\1 \end{matrix} \right]\tag{29}$
进一步整合得到：
$\left[\begin{matrix} \omega_{31j}x_j'-\omega_{11j}&\omega_{32j}x_j'-\omega_{12j}&\omega_{33j}x_j'-\omega_{13j}\\ \omega_{31j}y_j'-\omega_{21j}&\omega_{32j}y_j'-\omega_{22j}&\omega_{33j}y_j'-\omega_{23j} \end{matrix}\right] \left[\begin{matrix} u\\v\\w \end{matrix}\right]= \left[\begin{matrix} \tau_{xj}-\tau_{zj}x_j'\\ \tau_{yj}-\tau_{zj}y_j' \end{matrix}\right]\tag{30}$
将 $J$ 个形如式(30)等式整合成一个大的线性方程组，然后按照Least squares problem求解可得到一个合理的初始解，最后进行非线性迭代求解。

5.3 总结

该算法是三维重建算法的基础，它有以下特征：

该方法要求我们已知与场景中代求3D坐标点对应的 $J$ 个2D投影点坐标；
该方法要求我们已知所有 $J$ 个相机的内部参数和外部参数。

Fly_To_Sky666

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
针孔相机(The pinhole camera)

目录1 小孔成像1.1 The normalized camera1.2 Focal length parameters1.3 Offset and skew parameters1.4 Position and orientation of camera1.5 Full pinhole camera model2 齐次坐标系2.1 齐次坐标下的相机模型3 学习外部参数3.1 问题描述3.2 求解过程4 学习内部参数4.1 问题描述4.2 求解过程5 推理三维坐标点5.1 问题描述5.2 求解过程1 小孔
复制链接

扫一扫