Dogleg法（狗腿法）的推导与步骤

最新推荐文章于 2024-01-22 22:24:16 发布

cafe-BABE

最新推荐文章于 2024-01-22 22:24:16 发布

阅读量1.5w

点赞数 44

分类专栏：算法

本文链接：https://blog.csdn.net/qq_35590091/article/details/94628887

版权

算法专栏收录该内容

32 篇文章

订阅专栏

本文深入探讨了信赖域法中的一种方法——Dogleg法，详细解析了其与G-N法及最速下降法的关系，介绍了如何判断使用哪种增量方法，并通过调整信赖域实现最优迭代步长。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

看SLAM视觉十四讲的时候了解到了信赖域法（Trust Region）的其中一种叫Dogleg，然而上网找了一圈，发现并没有较为详细的推导，自己整理了一下网上的资源，然后详细的推了一下：

首先L-M法是G-N法与最速下降法的混合形式，通过调整阻尼因子 $\mu$ 来在这两种方法之间切换，而狗腿法类似，只不过它是通过改变信赖域来实现的。这里可以分为两个问题：

如何判断是使用G-N法还是最速下降法的增量？
如果确定了是使用哪个方法，那么它对应的增量 $\Delta x_{k}$ 是多少？
狗腿法的增量为多少？

首先关于第二个问题，如果学过最速下降法和G-N法，那么可以知道，他们对应的增量分别为：

G-N法为: $x{_{k+1}}-x{_{k}}=-H^{^{-1}}g=h_{gn}$ 最速下降法为： $x{_{k+1}}-x{_{k}}=-\alpha J^{T}(x)f(x)=\alpha h_{sd}$

这里需要注意的是：最速下降法的增量的方向，也就是 $h_{sd}$ 的值，并不是雅克比矩阵的转置 $J^{T}(x)$ ，这里我绕了很久，发现，十四讲的书上的雅克比矩阵其实是 $F(x)=\frac{1}{2}\left \| f(x) \right \|^{2}$ 的雅克比矩阵，并不是f(x)的雅克比矩阵，如果我们将f(x)的雅克比矩阵计算出来为 J(x) ,那么F(x)的雅克比矩阵实际上是 $J^{T}(x)f(x)$ ，推导如下：

回到上面两个增量，这里的 $\alpha$ 为多少呢？推导如下：

然后我们将 $\alpha$ 和 $- J^{T}(x)f(x)$ 相乘，发现最速下降法的增量 $x{_{k+1}}-x{_{k}}=-\frac{g^{T}g}{g^{T}J^{T}(x)J(x)g}g=\alpha h_{sd}$ ，在网上很多地方都会将它命名为 $P{^{u}}$ 。

另外G-N法的增量 $x{_{k+1}}-x{_{k}}=-H^{^{-1}}g=h_{gn}$ ，网上很多地方将它命名为 $P^{B}$ 。

以上，我们解决了之前提出的第二个问题，也就是这两个方法的增量为多少：

最速下降法： $-\frac{g^{T}g}{g^{T}J^{T}(x)J(x)g}g$ （也可以叫做 $P{^{u}}$ 或者 $\alpha h_{sd}$ ）

G-N法： $-H^{^{-1}}g$ （也可以叫做 $P^{B}$ 或者 $h_{gn}$ ）

然后来解决剩下两个问题，这两个问题其实可以合起来，也就是问：狗腿法的增量和G-N法、最速下降法的增量有什么关系？

狗腿法“人为地”定义了利用信赖域来选择狗腿法的增量为多少（或者说狗腿法每一步的迭代步长），我在网上看到了两种方法，本质都是一样的，但是实施起来稍微有点不同：

方法一：

这里的三种情况可以对应如下的三个图（上面的 $\Delta$ 表示信赖域半径）：

利用上面的判断标准来得出狗腿法对应的迭代步长 $h_{dl}$ 。

方法二：

这里tau的选取方式如下：

需要注意的是第三个情况，这种情况 $h_{dl}$ 的值为delta，我们可以将等式两边同时求2范数的平方，并且将tau-1看做 $\beta$ ，于是可以写成： $delta^{2}=(p^{U}+\beta (p^{B}-p^{U}))^{T}(p^{U}+\beta (p^{B}-p^{U}))$