最优化八：高斯牛顿法、LM法

最新推荐文章于 2024-09-15 08:16:50 发布

LittleEmperor

最新推荐文章于 2024-09-15 08:16:50 发布

阅读量6.2k

点赞数 7

分类专栏：最优化方法

本文链接：https://blog.csdn.net/LittleEmperor/article/details/105136677

版权

最优化方法专栏收录该内容

8 篇文章 69 订阅

订阅专栏

梯度法： $x_{i+1} = x_i - \alpha _i \bigtriangledown f(x_i)$ ，负梯度方向

牛顿法： $x_{i+1} = x_i - A_i^{-1}\bigtriangledown f(x_i)$ ，A为Hession矩阵

高斯牛顿法： $x_{i+1} = x_i +\bigtriangleup x$ ， $\bigtriangleup x$ 为 $J^T(x_i)J(x_i)\bigtriangleup x = -J^T(x_i)f(x_i)$ 的解

LM法： $x_{i+1} = x_i +\bigtriangleup x$ ， $\bigtriangleup x$ 为 $(J^T(x_i)J(x_i)+\lambda D^TD )\bigtriangleup x = -J^T(x_i)f(x_i)$ 的解

1 高斯牛顿法（Gauss-Newton）

针对优化问题求解x使得f(x)取得最小值，采用高斯牛顿法，步骤如下：

step1：给定初始点 x_0

step2：对于第i此迭代，求解雅克比矩阵及函数值 J(x_i),f(x_i)

step3：求解增量方程 $J^T(x_i)J(x_i)\bigtriangleup x = -J^T(x_i)f(x_i)$ ，得到 $\bigtriangleup x$

step4：计算 $x_{i+1} = x_i + \bigtriangleup x$

step5：如果 $\bigtriangleup x$ 足够小，或者迭代次数达到阈值，停止，否则重复step2-5

证明过程如下：

对函数f(x)在 x_0 处进行一阶泰勒展开得到：

f(x) = f(x_0) + J(x_0)(x-x_0)

令 $\bigtriangleup x = x-x_0$ 得到：

$f(x_0+\bigtriangleup x) = f(x_0) + J(x_0)\bigtriangleup x$

求解x使得f(x)取得最小值等价于求解 $\bigtriangleup x$ 使得 $f(x_0+\bigtriangleup x)$ 取得最小值，即：

$\bigtriangleup x^* = argmin \frac{1}{2}\left \| f(x_0+\bigtriangleup x) \right \|^2=argmin\left \|f(x_0) + J(x_0)\bigtriangleup x \right \|^2$

等式右边平方展开得到：

$\frac{1}{2}(\left \| f(x_0) \right \|^2 +2f(x_0)^TJ(x_0)\bigtriangleup x + \bigtriangleup x^TJ^T(x_0)J(x_0)\bigtriangleup x )$

对 $\bigtriangleup x$ 求导等于0得到：

$J^T(x_0)J(x_0)\bigtriangleup x = -J^T(x_0)f(x_0)$

得到：

$\bigtriangleup x =-(J^T(x_0)J(x_0))^{-1}\cdot J^T(x_0)f(x_0)$

2 LM法（Levenberg-Marquadt法）

高斯牛顿法存在缺陷，就是它要求我们所用的 J^T(x_0)J(x_0) 矩阵是可逆的（而且是正定的），但实际数据中计算得到的JTJ却只有半正定性。也就是说，在使用Gauss Newton方法时，可能出现JTJ为奇异矩阵或者病态的情况，此时增量的稳定性较差，导致算法不收敛。更严重的是，就算我们假设H非奇异也非病态，如果我们求出来的步长△x太大，也会导致我们采用的局部近似不够准确，这样一来我们甚至都无法保证它的迭代收敛，哪怕是让目标函数变得更大都是可能的。