MSCKF的理解(3.4之(17)-(24))以及附录

fluggen_pferd

已于 2022-01-25 15:44:49 修改

阅读量121

点赞数

分类专栏： slam理解文章标签：线性代数计算机视觉

于 2022-01-24 17:23:21 首次发布

本文链接：https://blog.csdn.net/weixin_38880733/article/details/122665157

版权

slam理解专栏收录该内容

8 篇文章 0 订阅

订阅专栏

从世界坐标系看到的点的坐标（X,Y,Z）和相机看到的点（u,v）之间的关系

$\begin{bmatrix}u\\v\\1\end{bmatrix} =\frac{1}{Z}\begin{bmatrix}f_x,0,c_x\\0,f_y,c_y\\0,0,1\end{bmatrix}\begin{bmatrix}X \\Y\\Z\end{bmatrix}=\frac{1}{Z}KP$
其中K是内参矩阵。也就是如下关系：
$Z p = K P$

一般的，在相机外参R，t的情况下，就变成了
$Z p = K (R P + t)$

其中相机看到的点 $P^{cam}_j$ 和世界坐标系中的点 $P^{w}_j$ 的关系如下：
$P^{cam}_j = _w^{c}RP^w_j+_w^{c}P$

$\frac{\partial u_j}{\partial X^w}=\frac{\partial(\frac{r_{11}X^w+r_{12}Y^w+r_{13}Z^w+_w^{c}X}{r_{31}X^w+r_{32}Y^w+r_{33}Z^w+_w^{c}Z})}{\partial X^w}=-\frac{r_{11}}{(r_{31}X^w+r_{32}Y^w+r_{33}Z^w+_w^{c}Z)^2}=-\frac{r_{11}}{{(Z_j^{cam}})^2}$

$\frac{\partial u_j}{\partial Y^w}=-\frac{r_{12}}{(r_{31}X^w+r_{32}Y^w+r_{33}Z^w+_w^{c}Z)^2}=-\frac{r_{12}}{{(Z_j^{cam}})^2}$
…
所以，图像看到的点相对于其世界坐标中的点的导数是：
$J_{23}=\frac{p_j^c}{\partial X^wY^wZ^w}=-\frac{1}{(Z_j^{cam})^2}\begin{bmatrix}r_{11},r_{12},r_{13}\\r_{21},r_{22},r_{23} \end{bmatrix}$

从而有：
$\Delta p_j^c=J_{23}\Delta XYZ$
但是这个似乎和文章或者网上的推导不一样。

2D特征点的"微分"

按照文章公式（23）的理解，应该是：
$J_{23}=\frac{\partial p}{\partial XYZ}=\begin{bmatrix}\frac{\partial u}{\partial XYZ}\\\frac{\partial v}{\partial XYZ}\end{bmatrix}=\begin{bmatrix}\frac{\partial (\frac{X}{Z})}{\partial XYZ}\\\frac{\partial (\frac{Y}{Z})}{\partial XYZ}\end{bmatrix}=\begin{bmatrix}\frac{1}{Z},0,-\frac{X}{Z^2}\\0,\frac{1}{Z},-\frac{Y}{Z^2}\end{bmatrix}=\frac{1}{Z}\begin{bmatrix}1,0,-\frac{X}{Z}\\0,1,-\frac{Y}{Z}\end{bmatrix}$

从而：
$p-\hat{p}=\Delta p^c=J_{23}\Delta XYZ=J_{23}\Delta P^c$
等方程求解的时候， $\Delta p$ 和 $J_{23}$ 都是已知量（其中 $p$ 是图像获取， $\hat{p}$ 是估计量，是根据 $P$ 的估计 $\hat{P}$ 来的），求得 $\Delta P$ 这个未知量。这个未知量的新鲜血液来自于图像的2D特征点坐标 $p$ 。其实这个小p和大P通过雅可比的转换是相机坐标系下的自说自话。

根据3.3的说法，也即是公式（14），相机的pose是IMU的pose而来。相机和IMU之间的外参是固定的，所以这两者知道一个就知道另一个了。

根据3.4的说法，要先搞定相机的pose，然后再用观测的点的2D坐标来做最小二乘法来确定2D坐标的估计值。所以附录解释了如何确定相机的pose。

公式(19), $P^c = _w^cR(P^w-P^w_{cam})$ , 其中 $P_{cam}^w$ 代表相机的原点在世界坐标系中的位置。~~换种说法， $P^w = _c^wRP^c+P^w_{cam}$ ，这个公式和本文开头的公式 $P^{cam}_j = _w^{c}RP^w_j+_w^{c}P$ 的意义是一样的。~~ 但是对于公式(19)两边进行旋转和平移的求导是可以的。

说说公式(21)是怎么来的,首先在相机坐标系的框架内有：
$\Delta p^=J_{X}\Delta X_{}+J_{23}\Delta P^c$
这个公式的来源有两部分，分别是 $\Delta X$ 和 $\Delta P^c$ , 这两部分都和 $\Delta p$ 有着直接的关系：
和最后一个相机的状态有关系吗？ $\Delta p=p-\hat{p}$
$\hat{p}=p_N+RP$
其中，
$\Delta{X}=[\Delta X_{IMU}, \Delta \theta^c_1,\Delta P^w_1, \Delta \theta^c_2,\Delta P^w_2,..., \Delta \theta^c_N,\Delta P^w_N]$

$\Delta X_{IMU}=[\Delta\theta_{IMU},\Delta P_{IMU},\Delta v_{IMU},\Delta b_a,\Delta b_g]$

$\frac{\partial \Delta p}{\partial \Delta X_{IMU}}=[\frac{\partial\Delta{p}}{\partial \Delta\theta_{IMU}},\frac{\partial\Delta{p}}{\partial \Delta P_{IMU}},\frac{\partial\Delta{p}}{\partial \Delta v_{IMU}},\textbf{0},\textbf{0} ]==[\textbf{0},\textbf{0},\textbf{0},\textbf{0},\textbf{0}]$

著名的李代数求导：

$\frac{\partial \Delta p_j}{\partial \Delta \theta_j}=\frac{\partial \Delta p_j}{\partial \Delta P_j}\frac{\partial \Delta P_j}{\partial \Delta \theta_j}=J_{23}\frac{\partial \Delta R}{\partial \Delta\theta}=J_{23}Rp_{} \hat{}$

$\frac{\partial \Delta p_j}{\partial \Delta P_j}=J_{23}$

其中,
$J_{23}\Delta P^c=J_{23}{_w^c}R\Delta P^w=J_f\Delta P^w$

所以：
$\Delta p^=J_{X}\Delta X_{imu}+J_f\Delta P^w$

其中
$J_f=J_{23}{_w^c}R$

特征点三角化
从最小二乘法的原理开始理解，就是有一堆已知坐标的点，{ $x_i,y_i$ },现在需要求 $y = k x + b$ 的k,b，使得 $e=\Sigma|y_i-(kx_i+b)|^2$ 最小。
$\frac{\partial e}{\partial k}=-\Sigma (y_i-(kx_i+b))x_i=0$
$\frac{\partial e}{\partial b}=-\Sigma (y_i-(kx_i+b))=0$
轻松得出：
$\hat k=\frac{\Sigma x_i\Sigma y_i-n\Sigma x_iy_i}{n\Sigma x_i^2-(\Sigma x_i)^2}$
$\hat b=\frac{\Sigma x_i\Sigma x_iy_i-n\Sigma x_i^2\Sigma y_i}{n\Sigma x_i^2-(\Sigma x_i)^2}$

现在有一堆已知pose的相机 $R^{C_i},t^{C_i}$ ,和一个未知的世界点P(X,Y,Z)在每个相机当中的2D观测量 $u_i,v_i)$ ,求世界点的坐标估计值.
世界点在相机系的2D坐标是(忽略相机内参)： $(u_i,v_i,1)'=\frac{1}{Z^{C_i}}(R^{C_i}P+t^{C_i})$
其中，相机坐标系下的 $P^c$ 都是世界坐标系的P的元素的线性组合：
$X^c=r_{11}X^w+r_{12}Y^w+r_{13}Z^w+_w^{c}X$
…
误差函数：

$e=\Sigma[(u_i-\frac{X^{C_i}}{Z^{C_i}})^2+(v_i-\frac{Y^{C_i}}{Z^{C_i}})^2]$

$\frac{\partial e}{\partial X}=\Sigma 2[(u_i-\frac{X^{C_i}}{Z^{C_i}})(-\frac{1}{Z^{C_i}}\frac{\partial X^{C_i}}{\partial X}+\frac{X^{C_i}}{(Z^{C_i})^2}\frac{\partial Z^{C_i}}{\partial X})+(v_i-\frac{Y^{C_i}}{Z^{C_i}})(-\frac{1}{Z^{C_i}}\frac{\partial Y^{C_i}}{\partial X}+\frac{Y^{C_i}}{(Z^{C_i})^2}\frac{\partial Z^{C_i}}{\partial X})]\\=\Sigma 2[(u_i-\frac{X^{C_i}}{Z^{C_i}})(-\frac{1}{Z^{C_i}}r_{11}+\frac{X^{C_i}}{(Z^{C_i})^2}r_{13})+(v_i-\frac{Y^{C_i}}{Z^{C_i}})(-\frac{1}{Z^{C_i}}r_{12}+\frac{Y^{C_i}}{(Z^{C_i})^2}r_{13})]=0$

但是 $\begin{bmatrix}\frac{\partial e}{\partial X}\\\frac{\partial e}{\partial Y}\\\frac{\partial e}{\partial Z}\end{bmatrix}=\textbf{0}$ 不构成一个线性方程组，如何求得P？

原文中的替代方法什么 $\alpha=\frac{X}{Z}$ 之类的也是没有什么用的，因为改变不了原文中z是一个分数的结构。最终没有办法得出一个线性方程组。我也比较疑惑这么有名的文章为啥会浆糊。

重投影误差的思考
其实我觉得这里的目标函数 $e=\Sigma[(u_i-\frac{X^{C_i}}{Z^{C_i}})^2+(v_i-\frac{Y^{C_i}}{Z^{C_i}})^2]$ 是重投影误差。只是这里需要借助一些非线性最小二乘的方法了。

fluggen_pferd

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MSCKF的理解(3.4之(17)-(24))以及附录

从世界坐标系看到的点的坐标（X,Y,Z）和相机看到的点（u,v）之间的关系（假设内参cx,cyc_x,c_ycx,cy都是0）[uv1]=1Z[fx,0,cx0,fy,cy0,0,1][XYZ]=1ZKP\begin{bmatrix}u\\v\\1\end{bmatrix}=\frac{1}{Z}\begin{bmatrix}f_x,0,c_x\\0,f_y,c_y\\0,0,1\end{bmatrix}\begin{bmatrix}X \\Y\\Z\end{bmatrix}=\frac{1}{Z}
复制链接

扫一扫