为什么在SLAM中使用链式求导？为什么对微小扰动进行求导？

最新推荐文章于 2022-11-05 17:18:53 发布

擦擦擦大侠

最新推荐文章于 2022-11-05 17:18:53 发布

阅读量478

点赞数

分类专栏： SLAM

本文链接：https://blog.csdn.net/chenshiming1995/article/details/113095707

版权

SLAM 专栏收录该内容

4 篇文章 3 订阅

订阅专栏

本文解析了SLAM中链式求导的应用，通过高斯牛顿法和微小扰动求导，揭示了如何将优化问题转化为寻找delta_x，展示了在PNP和微变量求导中的具体过程。非线性优化与微小变量求导是SLAM背后的数学工具。

摘要由CSDN通过智能技术生成

为什么在SLAM中使用链式求导？为什么对微小扰动进行求导？

链式求导是一个很常用、很简单的模型，但是为什么用这个模型呢？在SLAM十四讲中并没有对这个问题进行阐述。

这与非线性优化的方法有关，首先对于一个最小二乘问题：
$\min _{x} \frac{1}{2}\|f(\boldsymbol{x})\|_{2}^{2}$
高斯牛顿法是处理这个问题最简单的方法，它的做法是将f(x)进行泰勒展开：
$f(\boldsymbol{x}+\Delta \boldsymbol{x}) \approx f(\boldsymbol{x})+\boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}$
然后开始求J最小时，delta_x的值。首先进行展开：
$\begin{aligned} \frac{1}{2}\|f(\boldsymbol{x})+\boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}\|^{2} &=\frac{1}{2}(f(\boldsymbol{x})+\boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x})^{T}(f(\boldsymbol{x})+\boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}) \\ &=\frac{1}{2}\left(\|f(\boldsymbol{x})\|_{2}^{2}+2 f(\boldsymbol{x})^{T} \boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}+\Delta \boldsymbol{x}^{T} \boldsymbol{J}(\boldsymbol{x})^{T} \boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}\right) \end{aligned}$
然后对delta_x进行求偏导，并令其为0：
$\boldsymbol{J}(\boldsymbol{x})^{T} \boldsymbol{J}(\boldsymbol{x}) \Delta \boldsymbol{x}=-\boldsymbol{J}(\boldsymbol{x})^{T} f(\boldsymbol{x})$
这样得到的delta_x可以让惩罚函数达到最小。这就让函数从一个寻找最优x的问题转换成为寻找最优delta_x问题，而让x成为当前迭代的初始条件，这就是非线性优化、最小二乘方法的核心最底层的逻辑。

在这个过程中对x求导的过程变成了对delta_x求导数，这种方法对我们理解SLAM中的求导是十分有用的。

因此在PNP中，同样对微小变量delta_zeta进行求导。
$\frac{\partial e}{\partial \delta \boldsymbol{\xi}}=\lim _{\delta \boldsymbol{\xi} \rightarrow 0} \frac{e(\delta \boldsymbol{\xi} \oplus \boldsymbol{\xi})}{\delta \boldsymbol{\xi}}=\frac{\partial \boldsymbol{e}}{\partial \boldsymbol{P}^{\prime}} \frac{\partial \boldsymbol{P}^{\prime}}{\partial \delta \boldsymbol{\xi}}$
这里的 ⊕ 指李代数上的左乘扰动。第二项为变换后的点关于李代数的导数，
$\frac{\partial \boldsymbol{P}^{\prime}}{\partial \delta \boldsymbol{\xi}}=\left[\boldsymbol{I},-\boldsymbol{P}^{\prime \wedge}\right]$

推导参考。

$\begin{aligned} &\frac{\partial \tilde{\mathbf{P}}^{\prime}}{\partial \boldsymbol{\xi}}=\frac{\partial(\mathbf{T} \cdot \tilde{\mathbf{P}})}{\partial \boldsymbol{\xi}}\\ &=\frac{\partial\left(\exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}\right)}{\partial \delta \boldsymbol{\xi}} \quad(\text { 左扰动模型 }) \end{aligned}$

$\begin{array}{l} =\lim _{\delta \xi \rightarrow 0} \frac{\exp \left(\delta \boldsymbol{\xi}^{\wedge}\right) \exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}-\exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}}{\delta \boldsymbol{\xi}} \\ \approx \lim _{\delta \xi \rightarrow 0} \frac{\left(\mathbf{I}+\delta \boldsymbol{\xi}^{\wedge}\right) \exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}-\exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}}{\delta \boldsymbol{\xi}} \end{array}$

$\begin{array}{l} =\lim _{\delta \xi \rightarrow 0} \frac{\delta \boldsymbol{\xi}^{\wedge} \exp \left(\boldsymbol{\xi}^{\wedge}\right) \tilde{\mathbf{P}}}{\delta \boldsymbol{\xi}} \\ =\lim _{\delta \xi \rightarrow 0} \frac{\left[\begin{array}{cc} \delta \boldsymbol{\phi}^{\wedge} & \delta \boldsymbol{\rho} \\ \mathbf{0}^{T} & 0 \end{array}\right]\left[\begin{array}{c} \mathbf{R} \cdot \mathbf{P}+\mathbf{t} \\ 1 \end{array}\right]}{\delta \boldsymbol{\xi}} \\ =\lim _{\delta \xi \rightarrow 0} \frac{\left[\begin{array}{c} \delta \boldsymbol{\phi}^{\wedge}(\mathbf{R} \cdot \mathbf{P}+\mathbf{t})+\delta \boldsymbol{\rho} \\ 0 \end{array}\right]}{\delta \boldsymbol{\xi}} \end{array}$

$\begin{array}{l} =\left[\begin{array}{cc} \mathbf{I} & -(\mathbf{R} \cdot \mathbf{P}+\mathbf{t})^{\wedge} \\ \mathbf{0}^{T} & \mathbf{0}^{T} \end{array}\right] \\ =\left[\begin{array}{cc} \mathbf{I} & -\mathbf{P}^{\prime \wedge} \\ \mathbf{0}^{T} & \mathbf{0}^{T} \end{array}\right] \end{array}$