摄影几何基础知识1

小屁孩__

已于 2022-11-01 14:32:54 修改

阅读量234

点赞数

文章标签：线性代数计算机视觉矩阵

于 2022-01-22 09:00:32 首次发布

本文链接：https://blog.csdn.net/TZ_li_gen/article/details/122632836

版权

文章目录

- 第一章：相机模型和对极几何

第一章：相机模型和对极几何

第1节：相机模型

1.针孔相机模型

（1）空间中两个坐标系之间的变化属于刚体变换，可由旋转矩阵 $R$ 和平移向量 $t$ 描述，则世界坐标系到相机坐标系表示为：
$X_c=RX_w+t$
平移向量 $t$ 的意义是世界坐标系的原点在相机坐标系中的表达；由于旋转矩阵是正交阵， $R^TR=E$ ，因此相机坐标系到世界坐标系可由表示为：
$X_w=R^TX_c-R^Tt$
相机中心 $O_c$ 在世界坐标系的表示为：
$X_w^c=-R^Tt$
相机坐标系的 $Z$ 轴在世界坐标系中的表示为旋转矩阵的第三行，

证明：设 $r_c=Z_c -O_c=[0\quad0\quad1]^T$ ,则
$r_w=(R^TZ_c-R^Tt)-(R^TO_c-R^Tt)=R^T\begin{bmatrix}0 \\ 0 \\ 1\end{bmatrix}$
（2）相机坐标系到物理像平面坐标系

物理像平面：相机CCD阵列所在的平面。物理像平面与相机坐标系中心的距离为焦距 $f$ .

这个过程由三维的点变换到2维，会损失深度信息
$\begin{bmatrix} x \\ y \\ 1 \end{bmatrix}=\frac{1}{z_{c}}\begin{bmatrix} f & 0 & 0 \\ 0 & f & 0 \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} x_{c} \\ y_{c} \\ z_{c} \end{bmatrix}$
（3）物理像平面坐标系到图像坐标系

图像坐标系一般以左上角为坐标原点，需要进行离散化和坐标系平移。 $d x 、 d y$ 表示一个像素的宽和高(mm).
$\begin{bmatrix} u \\ v \\ 1 \end{bmatrix}=\begin{bmatrix} 1/dx & 0 & u_0 \\ 0 & 1/dy & v_0 \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} x \\ y\\ z \end{bmatrix}$
整个成像过程可以描述为：
$\begin{bmatrix} u \\ v \\ 1 \end{bmatrix}=\frac{1}{z_{c}}\begin{bmatrix} f/dx & 0 & u_0 \\ 0 & f/dy & v_0 \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} R&t \\ \end{bmatrix}\begin{bmatrix} X_{w} \\ Y_{w} \\ Z_{w}\\ 1 \end{bmatrix}=\frac{1}{z_{c}}K\begin{bmatrix} R&t \\ \end{bmatrix}\begin{bmatrix} X_{w} \\ Y_{w} \\ Z_{w}\\ 1 \end{bmatrix}$
设系统矩阵 $P=K[R\quad t]$ ，其中内参为 $K$ 、外参为 $[R\quad t]$ .

2.畸变模型

相机畸变模型，一般只考虑径向畸变 $k$ 和切向畸变 $p$ ，畸变参数也很重要的，也是内参的重要组成。

径向畸变主要由镜头径向曲率产生（光线在远离透镜中心的地方比靠近中心的地方更加弯曲）。导致真实成像点向内或向外偏离理想成像点。

径向畸变模型：
$\begin{aligned} &x_{\text {distorted }}=x\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right) \\ &y_{\text {distorted }}=y\left(1+k_{1} r^{2}+k_{2} r^{4}+k_{3} r^{6}\right) \end{aligned}$

畸变模型：枕型畸变 $(k > 0)$ ，畸点相对于理想像点沿径向向外偏移，远离中心的；

桶型畸变 $(k < 0)$ ，畸点相对于理想点沿径向向中心靠拢。

分析：畸变模型与距离成正比，当 $k > 0$ 时，物点离中心点越远， $x_{\text {distorted }}$ 越大，呈现枕形。
请添加图片描述

即：当k>0时，r越大（点离中心越远），畸变量越大，r越小，畸变量越小，呈枕型。

当k<0时，r越大（点离中心越远），畸变量越小，r越小，畸变量越大，呈桶型。

切向畸变模型：
$x_{\text {distorted }}=x+2 p_{1}y+p_{2}\left(r^{2}+2 x^{2}\right) \\ y_{\text {distorted }}=y+2 p_{2}x+p_{1}\left(r^{2}+2 y^{2}\right)$

其中 $r^2=x^2+y^2$ , 因此我们一共需要5个畸变参数 $k_1,k_2,k_3,p_1,p_2)$ 描述透镜畸变。

畸变系数求解方法：

提供理想点 $u,v]^T$ 和畸变点 $u',v']^T$ 的对应关系，通过最小二乘进行估计.

畸变的矫正：

只涉及两个坐标之间的变换，有两种插值的方法。

至此，相机模型分析分析完了

外参 $[R\quad t]$ ：6个自由度，其中旋转矩阵可由三个欧拉角表示，平移矩阵也由三个平移量表示。外参估计对应计算机视觉中的姿态估计

内参：一般9个，缩放因子 $s$ 、焦距 $f$ 、主点坐标 $u_0,v_0)$ 、畸变系数 $k_1、k_2、k_3、p_1、p_2$ 。内参的估计对应计算视觉中的相机标定

相机标定的目的：获取畸变系数，对图像进行矫正

内参决定了图像的分辨率和图像的大小，在矫正后，可以人为给定。

第2节：特征检测与匹配

1.特征检测子

Harris角点检测：常用于跟踪，不具有尺度不变性， $k$ 越大，越灵敏

核心思想：让窗口内的差异足够大

$C=det(H)-k\cdot trace(H)^2=\lambda_1\lambda_2-k(\lambda_1+\lambda_2)^2,k=0.04$

SIFT特征点检测：具有尺度、旋转、光照不变性，计算量大

ORB特征点检测：速度快、具有尺度旋转不变性

SuperPoint: Self Supervised Interest Point Detection and Description，深度学习提供极端场景下关键点的提取方法，但需要大量的训练数据才能够得到较好的泛化性

2.描述子：每个关键点的特征

SIFT，统计局部梯度信息，生成128维的特征描述子。将区域划分成 $4\times4$ 的block，把16个block的梯度方向的直方图(高斯加权梯度作为系数)并成128个特征。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-He0rR9hT-1642812637235)(images/1_sift.png)]
BRIEF，Binary Robust Independent Elementary Features

首先对图像进行平滑处理，然后在特征点周围随机选择 $N$ 对大小 $5\times5$ 的Patch，比较每对Patch内像素和的大小，生成了一个 $N$ 长的二进制串。
$\tau(p ; x, y)=\left\{\begin{array}{cc} 1, & \text {if}\quad p(x)<p(y) \\ 0, & \text { otherwise } \end{array}\right.$
描述向量由𝑁个0或者1组成 𝑁=128,256,512

生成速度快，匹配效率高，不具有旋转不变性
Steer BRIEF

对N对采样点 $S$ ,根据特征点的主方向计算旋转 $S_\theta=R_\theta S$ ,在新的采样点上进行BRIEF描述子生成。

3.特征点之间的距离，计算两幅图像中特征描述子的距离

欧式距离、马氏距离、归一化互相关：NCC、汉明距离

4.匹配策略

最近邻搜索： $a$ 的最近邻是 $b$ ， $b$ 的最近邻是 $a$ ，立体匹配中的视差一致性
$b^{\star}=\arg \min _{b \in B} D(\boldsymbol{a}, \boldsymbol{b}), D\left(a, b^{\star}\right)<\beta$
最近邻距离比(Lowe-ratio)：最近邻距离和次近邻距离的比值小于一个设定的阈值

快速最近邻搜索：

哈希表、多维Kd-tree等

第3节：2D-2D:对极几何

给定第一幅视图中像点 $x$ ，怎么约束第二幅视图中对应点 $x^{'}$ 的位置？

本质上，两幅视图之间的对极几何是图像平面与以极线为轴的平面束的交的几何。这种几何通常由立体匹配中搜索对应点的问题驱动的。本质矩阵是对极几何的代数表示

基线：左右相机光心的连线

对级平面：空间点，两个相机光心决定的平面

对极点：基线与两图像平面的交点

对极线：级平面与图像平面交线

在这里插入图片描述

设世界原点在 $O_1$ 处，则空间点P在 $O_1$ 相机坐标系中的坐标为 $X$ ，则在 $O_2$ 相机坐标系中的坐标为 $RX + t$

相机坐标系通过内参矩阵 $K$ 可转换到图像坐标系，可得：
$x_1=\frac{1}{Z_c}K_1X \\ x_2=\frac{1}{Z'_c}K_2(RX+t)$
等式分别左乘 $K_1^{-1}、K_2^{-1}$ 得：
$K_1^{-1}x_1=\frac{1}{Z_c}X \\ K_2^{-1}x_2=\frac{1}{Z'_c}(RX+t)$
消去 $X$ ，得：
${Z'_c}K_2^{-1}x_2=RZ_cK_1^{-1}x_1+t$
乘 $t$ 的反对称矩阵 $[t]_{\times}$ ，相当于 $t\times t=0$ ，消去 $t$ :
${Z'_c}[t]_{\times}K_2^{-1}x_2=Z_c[t]_{\times}RK_1^{-1}x_1$
两边同时左乘 $x_2^TK_2^{-T}$ ,得：
${Z'_c}x_2^TK_2^{-T}[t]_{\times}K_2^{-1}x_2=Z_cx_2^TK_2^{-T}[t]_{\times}RK_1^{-1}x_1$
因为 $x_2^TK_2^{-T}$ 与 $[t]_\times K_2^{-}x_2$ 的垂直，所以等式左边为0，得到：
$x_2^TK_2^{-T}[t]_{\times}RK_1^{-1}x_1=0$
注：利用上式具有尺度不确定性

该式描述了两个像素坐标 $x_1,x_2$ 之间的联系，或者称为一种约束关系，这个约束就叫做对极约束。

1.基础矩阵：

$F=K_2^{-T}[t]_{\times}RK_1^{-1}$

$F$ 是 $3\times3$ 的矩阵，具有7个自由度，秩为2

矩阵的秩，指经过初等变换后的非零行(列)的个数

矩阵的自由度指的要想求解矩阵所有元素，至少需要多少个线性方程组

有8个独立的比率(矩阵有9个元素，公共因子不重要，所以都除以最后一个元素，让最后一个元素为1)；因为 $[t]_\times$ 的秩为2，所以 $d e t (F) = 0$ ，

所以 $F$ 具有7个自由度，秩为2.
奇异值为 $[\sigma_1,\sigma_2,0 ]$
极线约束 $l_1^T=x_2^TF$ ， $l_2=Fx_1$ ， $x^T_2Fx_1=0$

2.本质矩阵：

$E=[t]_{\times}R$

$E$ 是 $3\times3$ 的矩阵，具有5个自由度，秩为2

旋转和平移矩阵一共6个自由度，公共因子不重要，所以都除以最后一个元素，让最后一个元素为1，所以 $E$ 具有5个自由度，秩为2.
一个 $3\times 3$ 矩阵是本质矩阵的充要条件是它的奇异值中有两个相等，而第三个为零。

即，奇异值为 $[\sigma,\sigma,0 ]$

3.基础矩阵求解方法

直接线性变换法

对与一对匹配点 $x_1=[u_1,v_1,1]^T$ ， $x_2=[u_2,v_2,1]^T$

根据对极约束 $x_2^TFx_1=0$ ,
$\left(\begin{array}{lll}u_{2} & v_{2} & 1\end{array}\right)\left[\begin{array}{lll}F_{11} & F_{12} & F_{13} \\ F_{21} & F_{22} & F_{23} \\ F_{31} & F_{32} & F_{33}\end{array}\right]\left(\begin{array}{c}u_{1} \\ v_{1} \\ 1\end{array}\right)=0$
令 $\boldsymbol{f}=\left[\begin{array}{llll}F_{11}, & F_{12}, & F_{13}, & F_{21}, & F_{22}, & F_{23}, & F_{31}, & F_{32}, & F_{33}\end{array}\right]^{T}$ , 则有，
$\left[\begin{array}{llll}u_{1} u_{2}, & u_{2} v_{1}, & u_{2}, & u_{1} v_{2}, & v_{1} v_{2}, & v_{2}, & u_{1}, & v_{1}, & 1\end{array}\right] \boldsymbol{f}=0$
每对匹配点提供一个约束，要保证有唯一解至少需要8对匹配点；

$n = 8$ 时，若 $A$ 非奇异，则有唯一解，称为8点法

$n \geq 8$ 时，可用最小二乘法求解。 $A^TA$ 的最小特征值对应的特征向量即为最优解。
奇异值约束

直接线性变换法无法保证基础矩阵的奇异值约束——有两个非0的奇异值

根据奇异值约束对矩阵进行重构：
$min||F-\hat{F}||,wrt.svd(F)=[\sigma_1,\sigma_2,0]$

对得到的基础矩阵 $\hat F$ 进行奇异值分解，即

$\hat{F}=USV^T \quad S=\text{diag}(\sigma_1,\sigma_2,\sigma_3)$

利用奇异值约束对基础矩阵进行重构
$F=U\text{diag}(\sigma_1,\sigma_2,0)V^T$

基于RANSAC的鲁棒方法

1.随机采样8对匹配点

2.8点法求解基础矩阵 $\hat F$ ；

3.奇异值约束获取基础矩阵 $F$ ；

4.计算误差，并统计内点个数；

内点判断标准—一阶几何误差(first-order geometric error)，又名辛普森距离(Sampson distance）：

令 $e=x_{2}^{T} F x_{1}, J=\frac{\delta\left(x_{i}^{\prime T} F x_{i}\right)}{\delta x_{i}}$ 则该对应点的辛普森距离为 $d(x_1,x_2)$ 为：
$d(x_1,x_2)=\frac{e^{T} e}{J J^{T}}=\frac{\left(x_{2}^{T} F x_{1}\right)^{2}}{\left(F x_{1}\right)_{x}^{2}+\left(F x_{1}\right)_{y}^{2}+\left(x_{2}^{T}F \right)_{x}^{2}+\left(x_{2}^{T}F\right)_{y}^{2}}$
内点的判断标准：
$d(x_1,x_2)<\tau$
5.重复上述过程，选择内点数最多的结果；

6.对所有内点执行2,3，重新计算 $F$ .

4.本质矩阵求解方法

先求基础矩阵 $F$ ，通过基础矩阵可得 $\hat E=K_2^TFK_1$
再对 $\hat E$ 进行奇异值分解： $\hat E=U\text{diad}(\sigma_1,\sigma_2,0)V^T$
利用奇异值约束对本质矩阵进行重构： $E=U\text{diad}(\frac{(\sigma_1+\sigma_2)}{2},\frac{(\sigma_1+\sigma_2)}{2},0)V^T$

5.相机姿态的恢复

由本质矩阵恢复相机姿态，会得到4种不同的姿态：
$E=U\operatorname{diag}(\sigma, \quad \sigma, \quad 0){V}^{T}\\ t_{1}={U}(:,2) \quad {R}_{1}={U} {R}_{Z}\left(\frac{\pi}{2}\right) {V}^{T}\\ {t}_{2}=-{U}(:,{2}) \quad {R}_{2}={U} {R}_{Z}^{T}\left(\frac{\pi}{2}\right) {V}^{T}\\ {R}_{Z}\left(\frac{\pi}{2}\right)=\left(\begin{array}{ccc}0, & -1, & 0 \\ 1, & 0, & 0 \\ 0, & 0, & 1\end{array}\right), {R}_{Z}^{T}\left(\frac{\pi}{2}\right)=\left(\begin{array}{ccc}0, & 1, & 0 \\ -1, & 0, & 0 \\ 0, & 0, & 1\end{array}\right)$

下面来看，如何得到准确的相机姿态：

利用相机姿态 $R, t$ 和匹配点 $x_1,x_2$ 进行三角量测，可得到三维点 $X$ ；

相机中心在世界坐标系的坐标为： $O_1=0 \quad O_2=-R^Tt$ ；

相机的世界坐标中的朝向： $d_1=[0,0,1]^T \quad d_2=r_3^T$ （旋转矩阵的第三行）；

$P$ 需满足同时位于两个相机的前方:

方法1：
$P-O_1)^Td_1>0\\ (P-O_2)^Td_1>0\\$
方法2：
$[X_c,Y_c,Z_c]^T=RP+t,\quad Z_c>0$

6.单应矩阵

空间中特征点 $X$ 位于一平面上，设平面的法向量为 $n^T$ ，则平面方程为：
$n^TX+d=0$
即：
$-\frac{n^TX}{d}=1$
推导单应性矩阵， $X$ 在 $O_2$ 相机坐标系中的表达为：
$x_2=K_2(RX+t)\\ =K_2(RX+t\cdot(-\frac{n^TX}{d}))\\ =K_2(R-\frac{tn^T}{d})X\\ =K_2(R-\frac{tn^T}{d})K_1^{-1}x_1$
定义单应性矩阵 $H$ 为： $H=K_2(R-\frac{tn^T}{d})K_1^{-1}$

即， $x_2=Hx_1$

单应性矩阵和空间的平面有关，也和平面到相机之间的变换有关。单应性矩阵是满秩的，当 $t = 0$

时， $H=K_2RK_1^{-1}$ 对应的是纯旋转。

即单应矩阵有两种情况：

1 . 空间点位于平面上

2 . 相机纯旋转

7单应性矩阵线性求解

$\left(\begin{array}{c} u_{2} \\ v_{2} \\ 1 \end{array}\right)=\left[\begin{array}{lll} H_{11} & H_{12} & H_{13} \\ H_{21} & H_{22} & H_{23} \\ H_{31} & H_{32} & H_{33} \end{array}\right]\left(\begin{array}{c} u_{1} \\ v_{1} \\ 1 \end{array}\right)$

$\begin{aligned} u_{2} &=\frac{H_{11} u_{1}+H_{12} v_{1}+H_{13}}{H_{31} u_{1}+H_{32} v_{1}+H_{33}} \\ v_{2} &=\frac{H_{21} u_{1}+H_{22} v_{1}+H_{23}}{H_{31} u_{1}+H_{32} v_{1}+H_{33}} \end{aligned}$

令 $H_{33}=1$ ，则单应性矩阵有8 个自由度，每对点有两个约束：
$\begin{aligned} &H_{11} u_{1}+H_{12} v_{1}+H_{13}-H_{31} u_{1} u_{2}-H_{32} u_{2} v_{1}=H_{33} u_{2} \\ &H_{21} u_{1}+H_{22} v_{1}+H_{23}-H_{31} u_{1} v_{2}-H_{32} v_{1} v_{2}=H_{33} v_{2} \end{aligned}$
RANSAC-估计单应矩阵