相机模型与坐标系

最新推荐文章于 2024-08-21 17:38:10 发布

Frank（Zhiyang-Dou）

最新推荐文章于 2024-08-21 17:38:10 发布

阅读量1.1k

点赞数

分类专栏： CV 文章标签： CV 视觉相机坐标参数

本文链接：https://blog.csdn.net/OOFFrankDura/article/details/105415394

版权

CV 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

个人笔记梳理。

坐标系

世界坐标系

一个相机是在3D空间中，如果我们想描述这个相机或者物品在空间中的位置，那么就是使用这个坐标系来描述相机的位置。 $X_w,Y_w,Z_w)$

相机坐标系

顾名思义，就是以相机为原点建立一个坐标系。 $(X, Y, Z)$ .
在这里插入图片描述

图像坐标系

图中以图像中心为原点建立的坐标系就是图像坐标系。
在这里插入图片描述

像素坐标系

图中以图像左上角为原点建立的坐标系就是像素坐标系。
在这里插入图片描述

坐标变换

一般来说对应的转换关系包括
相机坐标系 到 图像坐标系 到 像素坐标系

相机坐标系到图像坐标系

投影相机的一个特殊情况（理想模型）是透视(或中心)投影，当我们变换矩阵按焦距进行如下缩放时，就对应了我们熟悉的针孔相机：

已知相机坐标系是 $(X, Y, Z)$ 图像坐标系是 $(x, y)$ 。
设置 $f$ 为焦距（图像平面与相机坐标系原点的距离）

$\begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = \begin{bmatrix} f &0 & 0 & 0\\ 0 & f & 0 & 0 \\ 0 & 0 & 1 & 0 \end{bmatrix} \begin{bmatrix} X \\ Y \\ Z \\ 1 \end{bmatrix}$
所以
$\frac{fX}{Z}$
$\frac{fY}{Z}$
在这里插入图片描述
这是如何来的呢？
首先说可以简单把焦距理解为相机到图像空间的距离：

因此，对于下图中， $O$ 即代表了相机位置为， $f$ 即为焦距， $B$ 处是图像空间， $P$ 处是真实的物体， $P^{'}$ 是该物体经过相机对应在图像空间的点， $Z$ 是相机原点到物体的垂直距离。

在这里插入图片描述
因此有：

变换后得到：（注意这里的 $x, y$ 就是上图的 $X^{'}, Y^{'}$ ）
$\frac{fX}{Z}$
$\frac{fY}{Z}$

图像坐标系到像素坐标系

对于图像坐标系(x,y)和像素坐标系（u,v）
$\begin{matrix} u = \frac{x}{dx}+u_0\\ \\ u = \frac{y}{dy}+v_0\\ \end{matrix} \tag{1}$
此公式可以写到其次坐标系下：
$\begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = \begin{bmatrix} \frac{1}{dx} &0 &u_0 \\ 0 & \frac{1}{dy} & v_0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ 1 \end{bmatrix}$
（u0, v0）是图像坐标系原点在像素坐标系中的坐标，dx 和 dy相当于缩放因子，是每个像素在图像平面x和y方向上的尺寸比例。

综合上述：可以得到像素坐标系与相机坐标系的关系。（注意这里的 $X^{'}, Y^{'}$ 就是图像坐标。）
在这里插入图片描述
其次坐标系表达为：

世界坐标系到相机坐标系

给定一个物体或者说一个坐标。我们知道，在世界坐标系下他对应了一个坐标，但是他在相机坐标系下也对应了一个坐标。下面的公式将这两者统一。

这里下标为c的就是相机坐标，下标为w的就是世界坐标，其中 $R$ 为 $\times 3$ 的旋转矩阵， $t$ 是三维的平移向量。
在这里插入图片描述这个 $R, t$ 是相机的外部参数，一般用 $T$ 表示。

综合上述，世界坐标系与像素坐标系之间的关系为：
在这里插入图片描述

小结

综合上述：可以得到像素坐标系与相机坐标系的关系。（注意这里的 $X^{'}, Y^{'}$ 就是图像坐标。）
在这里插入图片描述
其次坐标系表达为：

影响投影结果的参数可以分为内外两类：内部/外部参数（intrinsic and/or extrinsic parameters）。内部参数指相机的内生特性，比如焦距、倾斜度、失真、画布中心等。外部参数指相机旋转矩阵、平移向量等。

回顾我们之前的公式:
$\frac{fX}{Z}$
$\frac{fY}{Z}$
这意味着我们在进行从相机坐标到图像坐标进行变换的时候我们是对每个点的深度Z进行放缩，投影到图像上。

但是在实际的应用中，最常见的假设其弱透视相机（weak perspective camera）。
在弱透视相机（weak perspective camera）中，从相机坐标到图像坐标进行变换时：
在这里插入图片描述
我们使用的是一个平均深度 $Z_{ave}$ 。使用一个constant深度 $Z_{ave}$ 去代替了每个点的深度 $Z_i$ ,从而使得分析变得简单。但是要满足弱透视的要求，需要满足几个假设：