图像形成（5）球面透视投影和近似相机模型

最新推荐文章于 2024-07-03 17:46:48 发布

YuYunTan

最新推荐文章于 2024-07-03 17:46:48 发布

阅读量4.5k

点赞数 2

分类专栏： SLAM 多视图几何计算机视觉文章标签：透视投影相机模型球面透视投影正交透视投影多几何视图计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuyuntan/article/details/84134965

版权

计算机视觉同时被 3 个专栏收录

44 篇文章 20 订阅

订阅专栏

多视图几何

23 篇文章 12 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

文章目录

图像形成（5）球面透视投影和近似相机模型
- 球面透视投影
- 近似相机模型

图像形成（5）球面透视投影和近似相机模型

球面透视投影

我们在博文图像形成（3）理想相机模型中描述的透视针孔相机模型考虑平面成像表面。另一种常用的成像表面是球体，如图1所示。

球面透视投影模型：三维点 $p$ 的像是穿过光学中心 $o$ 的光线与光学中心周围的半径为 $r$ 的球体的交点处的点 $x$ 。通常 $r$ 被选为 $1$ 。

这种选择的部分原因是生物系统中经常遇到的视网膜形状。对于球面投影，我们简单地选择成像表面为单位球面 $\mathbb{S}^2=\{p\in \mathbb{R}^3| ||X(p)||=1\}$ 。然后，球面投影被定义为由 $\mathbb{R}^3$ 到 $\mathbb{S}^2$ 的映射 $\pi_s$ ：

$\pi_s:\mathbb{R}^3 \rightarrow \mathbb{S}^2;X \mapsto x=\frac{X}{||X||}$

与平面透视投影的情况一样，点的像素坐标与其3D度量对应点之间的关系可表示为

$\lambda x^\prime = K\Pi_0X=K\Pi_0gX_0$

其中，在球面投影的情况下，尺度由 $\lambda=\sqrt{X^2+Y^2+Z^2}$ 给出，而在平面投影的情况下， $\lambda=Z$ 。因此，在数学上，球形投影和平面投影可以用同一组方程来描述。唯一的区别是未知（深度）尺度 $\lambda$ 采用不同的值。

为方便起见，我们经常为两个（齐次）向量 $x$ 和 $y$ 写 $x\sim y$ ,二者相差一个等价标量因子。所以我们看到我们有任何透视投影

$x^\prime \sim \Pi X_0=K\Pi_0gX_0$

并且所选择的成像表面的形状无关紧要。成像表面可以是任何（规则）表面，只要任一光线 $\vec{op}$ 中最多在一个点处与表面相交。例如，可以使用整类椭圆体表面，这导致在许多全向相机中流行的所谓的折反射模型（catadioptric model）。原则上，由此获得的所有图像包含完全相同的信息。

近似相机模型

透视投影模型最常用的近似是所谓的正交投影。

正交相机模型。图像来源于网络。

正交模型中的光线沿平行于光轴的线行进。在这种情况下，图像点和3D点之间的关系特别简单： $x = X, y = Y$ 。所以“正交相机的几何模型“可表示为：

$\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\end{bmatrix}\begin{bmatrix}X\\Y\\Z\end{bmatrix}$

或者只是以矩阵形式

${\rm x}=\Pi_1 \rm X$

其中 $\Pi_1=[I_{2\times 2},0]\in \mathbb{R}^{2\times 3}$

当观察点之间的深度变化远小于点与图像平面的距离时，正投影是透视投影的良好近似。在所观察的点位于与图像平面平行的平面上的情况下，点的图像基本上是原始的缩放版本。这种缩放可以明确地结合到正交投影模型中，从而导致所谓的弱透视模型。在这种情况下，图像点和三维点之间的关系是：

$x=f\frac{X}{\bar Z},y=f\frac{Y}{\bar Z}$

其中 $\bar Z$ 是相机观察点的平均距离。该模型适用于所有点位于前额平行平面中然后缩放因子对应于平面距原点的距离的情况。也就是缩放因子 $s=\frac{f}{\bar Z}$ 。我们可以将弱透视相机模型（比例正交）表达为：

$\begin{bmatrix}x\\y\end{bmatrix}=s\begin{bmatrix}1&0&0\\0&1&0\end{bmatrix}\begin{bmatrix}X\\Y\\Z\end{bmatrix}$

或者只是以矩阵形式

${\rm x}=s\Pi_1{\rm X}$

这些近似投影模型通常会导致简化和高效的算法，用于估计相机的未知结构和位移，尤其适用于满足模型假设的应用。

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YuYunTan 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。