视觉SLAM十四讲第五讲笔记

最新推荐文章于 2023-12-18 10:07:32 发布

Tianchao龙虾

最新推荐文章于 2023-12-18 10:07:32 发布

阅读量224

点赞数

分类专栏：视觉SLAM笔记文章标签： slam

本文链接：https://blog.csdn.net/wuchaohuo724/article/details/117768217

版权

视觉SLAM笔记专栏收录该内容

12 篇文章 0 订阅

订阅专栏

视觉SLAM十四讲第五讲笔记

这一讲主要说的是相机与图像。了解以下相机内参，空间点到相机成像平面的过程。

一、相机模型

相机模型包括

针孔相机模型
双目相机模型
RGB-D相机模型

1. 针孔相机模型

假设现实世界空间点 $P$ , 经过小孔 $O$ 投影之后，落在物理成像平面 $O^{'} - x^{'} - y^{'}$ 上，成像点为 $P^{'}$ 。设 $P$ 的坐标为 $X,Y,Z]^T$ ， $P^{'}$ 为 $X^{'}, Y^{'}, Z^{'}$ ，并且焦距为 $f$ 。那么根据三角形相似关系:

$\frac{Z}{f} = - \frac{X}{X'} = - \frac{Y}{Y'}$

负号表示成的像是倒立的。为了简化模型，我们把可以成像平面对称到相机前方，和三维空间点一起放在摄像机坐标系的同一侧。这样做可以把公式中的负号去掉，使式子更加简洁:
$\frac{Z}{f} = \frac{X}{X'} = \frac{Y}{Y'}$

整理可得:
$X'=f\frac{X}{Z} \\ Y'=f\frac{Y}{Z}$

上面的式子描述了世界空间点 $P$ 和它成像的空间关系。我们设在物理成像平面上固定着一个像素平面 $O - u - v$ 。我们在像素平面得到了 $P^{'}$ 的像素坐标: $u,v]^T$ 。

像素坐标的原点通常定义在图像的左上角， $u$ 轴向右与 $x$ 轴平行， $v$ 轴向下与 $y$ 轴平行。像素坐标系与成像平面之间，相差了一个缩放和一个原点的平移。我们设像素坐标在 $u$ 轴上缩放了 $α$ 倍，在 $v$ 上缩放了 $\beta$ 倍。同时，原点平移了 $c_x,c_y]^T$ 。那么， $P^{'}$ 的坐标与像素坐标 $u,v]^T$ 的关系为:
$\left \{ \begin{matrix} u = \alpha X'+c_x \\ v = \beta Y' + c_y \end{matrix} \right.$

把上面整理的式子代入，并將 $\alpha f$ 合并为 $f_x$ ，把 $\beta f$ 合并成 $f_y$ ，得到:
$\left \{ \begin{matrix} u = f_x \frac{X}{Z}+c_x \\ v = f_y \frac{Y}{Z} + c_y \end{matrix} \right.$

其中 $f$ 的单位是米， $\alpha. \beta$ 的单位是像素每米，所以 $f_x, f_y$ 的单位是像素。写成矩阵的形式就是熟悉的内参矩阵了:
$\biggl(\begin{matrix} u \\ v \\ 1 \end{matrix} \biggl) = \biggl(\begin{matrix} f_x \quad 0 \quad c_x \\ 0 \quad f_y \quad c_y \\ 0 \quad 0 \quad 1 \end{matrix} \biggl) \biggl(\begin{matrix} X \\ Y \\ Z \end{matrix} \biggl) \triangleq KP$

由于相机在运动，所以 $P$ 的相机坐标应该是它的世界坐标(记为 $P_w$ )，根据相机的当前位姿，变换到相机坐标系下的结果外参矩阵。

$ZP_{uv} = Z \biggl(\begin{matrix} u \\ v \\ 1 \end{matrix} \biggl) = K(RP_w + t) = KTP_w$

对于 $TP_w$ 这个三维向量，我们还可以按照齐次坐标的方式，把最后一维进行归一化处理，得到了 $P$ 在相机归一化平面上的投影。
$\tilde{P_c}=\biggl[\begin{matrix} X \\ Y \\Z \end{matrix}\biggl] = (TP_w)_{(1:3)}, \quad P_c=\biggl[\begin{matrix} X/Z \\ Y/Z \\1 \end{matrix}\biggl]$
这时 $P_c$ 可以看成一个二维的齐次坐标，称为归一化坐标。它位于相机前方 $z = 1$ 处的平面上。该平面称为归一化平面。

2、双目相机模型

针孔相机模型描述了单个相机的成像模型。然而，仅根据一个像素，我们是无法确定这个空间点的具体位置的。这是因为，从相机光心到归一化平面连线上的所有点，都可以投影至该像素上。而双目成像的原理如下:

两个相机水平放置，光圈中心都位于 $x$ 轴上，它们的距离称为双目相机的基线。如果一个空间点 $p$ ，它在左眼和右眼各成一像，记作 $P_L, P_R$ 。由于相机基线的存在，这两个成像位置是不同的。理想情况下，由于左右相机只有在 $x$ 轴上有位移，因此 $P$ 的像也只在 $x$ 轴(对应图像的 $u$ 轴)上有差异。我们记它在左侧的坐标为 $u_L$ ，右侧坐标为 $u_R$ 。根据三角形 $P−P_L-P_R$ 和 $P−O_L −O_R$ 的相似关系:
$\frac{z-f}{z} = \frac{b-u_L+u_R}{b}$
整理可得: