本文为视觉 SLAM 的学习总结,讲解 3D-2D 之直接线性方法(DLA)。欢迎交流
理论
3D-2D 是指,我们得到的两张图中,第一张图像存在深度信息,即已知 z c z_c zc。
可以这样理解:我们从第一个位置看到一个点的坐标,又从第二个位置看到同一个点。可以根据这个匹配关系求解出相加的位姿。
回顾相机模型中对【4 个坐标系的总结】,我们可以将世界坐标固定到第一个位置,这样相当于求解第二个位置在相机坐标系中的位姿即可。我们从像素坐标到世界坐标的公式为:
p = ( u v 1 ) = 1 z c ( f x 0 c x 0 f y c y 0 0 1 ) ( x c y c z c ) = 1 z c K T P W p=\left( \begin{matrix} u \\ v\\ 1 \end{matrix} \right)=\frac{1}{z_c}\left( \begin{matrix} f_x & 0 & c_x\\ 0 & f_y & c_y\\ 0 & 0& 1 \end{matrix} \right)\left( \begin{matrix} x_c \\ y_c\\ z_c \end{matrix} \right)=\frac{1}{z_c}KTP_W p=⎝⎛uv1⎠⎞=zc1⎝⎛fx000fy0cxcy