【MATH】Levenberg-Marquarelt法（LM法）

LJ工程师

于 2024-04-02 23:29:59 发布

阅读量792

点赞数 16

文章标签：算法笔记

本文链接：https://blog.csdn.net/weixin_44585637/article/details/137293579

版权

背景

最优化方法，也是一种迭代求函数极值的方法

核心内容

雅可比矩阵
梯度下降法
高斯牛顿法

特点

针对一些非线性的代价函数求解用最小二乘法有难度，用LM算法会简单许多。本质算是一种带阻尼的高斯-牛顿法

Levenberg-Marquarelt法

回顾A：牛顿法求解极值问题 $x_k=x_{k-1}-H(x_{k-1}^{-1})\triangledown f(x_{k-1})$

存在问题：
1.计算量大；
2.海森矩阵可能非正定难以求逆；
3.奇异矩阵，不能求逆；
4.不能保证目标函数是下降的；
5.不能保证收敛；

回顾B：梯度下降法求解极值问题

$x_k=x_{k-1}-\alpha \triangledown f(x)$
其中， $\alpha$ 是步长

LM法

$x_k=x_{k-1}-(H+\alpha I)^{-1}\triangledown f(x_{k-1})$

当下降太快时使用较小的 $\alpha$ ，使整个公式接近高斯牛顿法；
当下降太慢时使用较大的 $\alpha$ ，使整个公式接近梯度下降法

引：最小二乘问题

对于一个非线性最小二乘问题： $x=argmin_x F(x)=argmin_x\frac{1}{2}\sum_{i=1}^{N}||f(x)||^2$
则可以令：
$F(x)=\frac{1}{2}\sum_{i=1}^{N}||f(x)||^2=\frac{1}{2}||\mathbf{f}(x)||^2=\frac{1}{2}\mathbf{f}(x)^T\mathbf{f}(x)$
给出 $\mathbf{f}(x)$ 的一阶泰勒展开式：
$\mathbf{f}(x+h)=\mathbf{f}(x)+\mathbf{J}'(x)h+o(h^Th)$
去掉高阶项，代入到 $F (x)$ ：[了解向量函数运算]
$F(x+h)\simeq L(h)=\frac{1}{2}\mathbf{f}^T\mathbf{f}+h^T\mathbf{J}\mathbf{f}+\frac{1}{2}h^T\mathbf{J}^T\mathbf{J}h$ 到这里，如果是直接对 $h$ 求导，令其等于0，则是牛顿法的求解方法，难点在于 $\mathbf(J)^T\mathbf{J}$ 的逆难求，因此LM方法是加一个阻尼项 $\frac{1}{2}\mu h^Th$ :
$argmin_h G(H)=argmin_h \frac{1}{2}\mathbf{f}^T\mathbf{f}+h^T\mathbf{J}\mathbf{f}+\frac{1}{2}h^T\mathbf{J}^T\mathbf{J}h+\frac{1}{2}\mu h^Th$
因此，上式对 $h$ 求偏导=0【Why?：微积分+泰勒展开式】，得到：
$h=-\frac{g}{\mathbf{H}+\mu\mathbf{I}}$
其中：
$\mathbf{H}=\mathbf{J}^T\mathbf{J} , g=\mathbf{J}^T$