视觉SLAM14讲笔记02:ch5针孔,双目相机模型

相机

相机将三维世界中的坐标点(单位为米)映射到二维图像平面(单位为像素)的过程能够用一个几何模型进行描述。这个模型有很多种,其中最简单的称为针孔模型。针孔模型是很常用,而且有效的模型,它描述了一束光线通过针孔之后,在针孔背面投影成像的关系。在本书中我们用一个简单的针孔相机模型来对这种映射关系进行建模。同时,由于相机镜头上的透镜的存在,会使得光线投影到成像平面的过程中会产生畸变。因此,我们使用针孔和畸变两个模型来描述整个投影过程。

针孔相机模型根据三角形相似关系

在这里插入图片描述
Z f = − X X ′ = − Y Y ′ \frac{Z}{f}=-\frac{X}{X^{\prime}}=-\frac{Y}{Y^{\prime}} fZ=XX=YY
其中负号表示成的像是倒立的。为了简化模型,我们把可以成像平面对称到相机前方,和三维空间点一起放在摄像机坐标系的同一侧,如图5-2中间的样子所示。这样做可以使式子更加简。
X ′ = f X Z Y ′ = f Y Z \begin{array}{l} X^{\prime}=f \frac{X}{Z} \\ Y^{\prime}=f \frac{Y}{Z} \end{array} X=fZXY=fZY
式(5.3)描述了点 P 和它的像之间的空间关系。不过,在相机中,我们最终获得的是一个个的像素,这需要在成像平面上对像进行采样和量化。为了描述传感器将感受到的 光线转换成图像像素的过程,我们设在物理成像平面上固定着一个像素平面 $o-u-v $。 我 们在像素平面得到了 P ′ P' P 的像素坐标: [ u , v ] T [u, v]^{T} [u,v]T
像素坐标系“通常的定义方式是:原点 o’ 位于图像的左上角, 轴向右与 x x x 轴平行, v v v 轴向下与 y y y 轴平行。像素坐标系与成像平面之间,相差了一个缩放和一个原点的平移。 我们设像素坐标在 u u u 轴上缩放了 α \alpha α倍,在 v v v 上缩放了 β \beta β 倍。同时,原点平移了 [ c x , c y ] T \left[c_{x}, c_{y}\right]^{T} [cx,cy]T 那么, P ′ P' P 的坐标与像素坐标 [ u , v ] T [u, v]^{T} [u,v]T 的关系为:
{ u = α X ′ + c x v = β Y ′ + c y \left\{\begin{array}{l} u=\alpha X^{\prime}+c_{x} \\ v=\beta Y^{\prime}+c_{y} \end{array}\right. {u=αX+cxv=βY+cy
α f \alpha f αf 合并成 f x , f_{x}, fx, β f \beta f βf 合并成 f y , f_{y}, fy, 得:
{ u = f x X Z + c x v = f y Y Z + c y \left\{\begin{array}{l} u=f_{x} \frac{X}{Z}+c_{x} \\ v=f_{y} \frac{Y}{Z}+c_{y} \end{array}\right. {u=fxZX+cxv=fyZY+cy
其中, f f f 的单位为米, α , β \alpha, \beta α,β 的单位为像素每米,所以 f x , f y f_{x}, f_{y} fx,fy 的单位为像素。把该式写成矩阵形式,用到齐次坐标,会更加简洁,像素点的归一化坐标:
x = ( u v 1 ) = 1 Z ( f x 0 c x 0 f y c y 0 0 1 ) ( X Y Z ) ≜ 1 Z K P x= \left(\begin{array}{l} u \\ v \\ 1 \end{array}\right)=\frac{1}{Z}\left(\begin{array}{lll} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{array}\right)\left(\begin{array}{l} X \\ Y \\ Z \end{array}\right) \triangleq \frac{1}{Z} \boldsymbol{K} \boldsymbol{P} x=uv1=Z1fx000fy0cxcy1XYZZ1KP

该式中,我们把中间的量组成的矩阵称为相机的内参数矩阵(Camera Intrinsics) K K K .

双目相机模型

双目相机一般由左眼和右眼两个水平放置的相机组成。我们可以把两个相机都看作针孔相机。它们是水平放置的,意味两个相机的光圈中心都位于 x x x轴上。它们的距离称为双目相机的基线(Baseline, 记作 b b b ),是双目的重要参数。
在这里插入图片描述
理想情况下,由于左右相机只有在 x x x轴上有位移, 因此 P P P的像也只在 x x x轴(对应图像的 u u u轴)上有差异。根据相似关系
z − f z = b − u L + u R b \frac{z-f}{z}=\frac{b-u_{L}+u_{R}}{b} zzf=bbuL+uR
整理得
z = f b d , d = u L − u R z=\frac{f b}{d}, \quad d=u_{L}-u_{R} z=dfb,d=uLuR

这里 d d d为左右图的横坐标之差,称为视差(Disparity)。根据视差,我们可以估计一 个像素离相机的距离。视差与距离成反比。然由视差计算深度的公式很简洁,但视差 d d d本身的计算却比较困难。我们需要确切地知道左眼图像某个像素出现在右眼图像的哪一个位置(即对应关系),这件事亦属于 “人类觉得容易而计算机觉得困难”的事务。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值