本讲主要是相机模型相关的内容,理解比较容易。
注:
1)学习视频:【高翔】视觉SLAM十四讲。
第5讲
5.1 理论部分
前面主要围绕位姿进行讨论(求解及优化相关),这一讲主要针对观测问题,与相机模型有关。
1)相机模型
- 单目相机模型主要使用针孔模型;
注:
图片来源:针孔相机模型和相机镜头畸变模型。
- 依据相似三角形并去掉负号,结合单位变换(像素与米之间的转换)、图像原点在像素系的平移,可以得到相机系与像素系之间的关系——内参矩阵 K \pmb{K} KKK,对应公式 Z ( u v 1 ) = ( f x 0 c x 0 f y c y 0 0 1 ) ( X Y Z ) = d e f K P Z\begin{pmatrix} u \\ v \\ 1\end{pmatrix}=\begin{pmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1\end{pmatrix}\begin{pmatrix} X \\ Y \\ Z\end{pmatrix}\overset{def}{=}\pmb{KP} Z⎝⎛uv1⎠⎞=⎝⎛fx000fy0cxcy1⎠⎞⎝⎛XYZ⎠⎞=defKPKPKP,其实际意义是改变 Z Z Z时,投影点仍是同一个;
注:
图片来源:【高翔】视觉SLAM十四讲。
- 内参矩阵 K K K出厂后固定不变(但若对图像剪切或压缩等操作改变分辨率后, K K K会改变,则需要重新标定);
- 世界系与相机系之间的关系——外参矩阵 T \pmb{T} TTT(实际是相机的位姿 R , t R,t R,t,可以直接用变换矩阵 T T T代替),外参矩阵是会改变的;
- 世界系到像素系的变换对应公式
Z
P
u
v
=
Z
[
u
v
1
]
=
K
(
R
P
W
+
t
)
=
K
T
P
W
Z\pmb{P}_{uv}=Z\begin{bmatrix} u \\ v \\ 1\end{bmatrix}=\pmb{K}(\pmb{RP}_W+\pmb{t})=\pmb{KT}\pmb{P}_W
ZPPPuv=Z⎣⎡uv1⎦⎤=KKK(RPRPRPW+ttt)=KTKTKTPPPW,公式中也隐含了多次齐次与非齐次的变换(首先世界系下的
3×1
维 P W \pmb{P}_W PPPW齐次为4×1
维,然后左乘4×4
维的变换矩阵 T \pmb{T} TTT,得到4×1
维结果,再非齐次为3×1
维,左乘3×3
维内参矩阵 R \pmb{R} RRR,得到3×1
维结果;若将公式左边的 Z Z Z移到右边,则相当于将右边3×1
维结果归一化(非齐次)为2×1
维结果,与左边剩下的2×1
维像素坐标 P u v \pmb{P}_{uv} PPPuv对应); - 畸变模型包含径向畸变和切向畸变2部分。径向畸变含有桶形畸变(图像变小)和枕型畸变(图像变大),与像素和图像中心的距离有关;切向畸变与安装误差有关;
- 通常对归一化平面上的点计算畸变;
- 单目相机成像过程:世界系 P W \pmb{P}_W PPPW ⟶ T \stackrel{T}{\longrightarrow} ⟶T 相机系 ⟶ / Z \stackrel{/Z}{\longrightarrow} ⟶/Z 归一化平面 P c \pmb{P}_c PPPc ⟶ 畸变 \stackrel{\text{畸变}}{\longrightarrow} ⟶畸变 像素系 P u v \pmb{P}_{uv} PPPuv;
- 双目相机模型可看作是2个针孔模型,原理主要基于下图;
注:
图片来源:相机模型和双目立体匹配。
- 依据右边的两个相似三角形关系,有 z − f z = b − u L + u R b \frac{z-f}{z}=\frac{b-u_L+u_R}{b} zz−f=bb−uL+uR,整理得 z = f b d z=\frac{fb}{d} z=dfb, d = u L − u R d=u_L-u_R d=uL−uR为视差(视差最小为1个像素,双目深度存在理论上的最大值);
- 双目成像时,基线 b b b越长,可计算的距离越远;视差 d d d越小,物体距离相机越近;
- RGB-D相机一般有2种测量深度的方式:红外结构光(依据返回的结构光图案)和ToF(依据光束飞行时间)。RGB-D相机可以生成彩色图,以及与彩色图像素信息对应的深度图。
2)图像
- 图像用矩阵(二维数组)表示,一般图像系的原点在图像左上角,每个像素位置 ( x , y ) (x,y) (x,y)对应一个灰度值 I I I, x x x表示行, y y y表示列;
- 灰度图的灰度用0~255表示,对应全黑 ⟶ {\longrightarrow} ⟶全白;
- 深度图的信息用0~65535表示,每1000表示1m,最大可表示65m;
- 彩色图有三个通道,每个通道(R、G、B)用0~255表示,有时也用A表示透明度,则为R、G、B、A四个通道。
5.2 实践部分
待续ing