高斯牛顿法和LM法

最新推荐文章于 2023-06-21 17:06:09 发布

anArkitek

最新推荐文章于 2023-06-21 17:06:09 发布

阅读量7.4k

点赞数 1

分类专栏： Convex Optimization Mathematics 文章标签： Mathematics

本文链接：https://blog.csdn.net/anArkitek/article/details/101092590

版权

本文介绍了高斯牛顿法和Levenberg-Marquardt（LM）法在解决非线性最小二乘问题中的应用。高斯牛顿法简化了牛顿法，通过忽略残差项来避免计算Hessian矩阵，但可能在特定情况下不收敛。LM法则通过引入阻尼系数来改进，兼顾梯度下降法和高斯牛顿法的优点，提高了算法的稳定性和收敛性。

摘要由CSDN通过智能技术生成

文章目录

- 1. 高斯牛顿法
- 2. LM (Levenberg-Marquart) 法

以线性回归为例，假设最佳函数为 $y=\bold{\theta}^T\mathbf{x}$ , 对于每对观测结果 $x^{(i)},y^{(i)})$ ，都有
$y^{(i)}=\theta^T x^{(i)} + \epsilon^{(i)}$
最后就是从下式求解 $\bold{\theta}$ 。

$\mathbf{y} = \begin{bmatrix} \mathbf{x}_1 \\ \mathbf{x}_2 \\ ... \\ \mathbf{x}_m \\ \end{bmatrix} \bold{\theta}$

1. 高斯牛顿法

高斯-牛顿法是在牛顿法基础上进行修改得到的，用来(仅用于)解决非线性最小二乘问题。高斯-牛顿法相较牛顿法的最大优点是不需要计算二阶导数矩阵(Hessian矩阵)，当然，这项好处的代价是其仅适用于最小二乘问题。如下是其推导过程：

首先，假设 $r(\mathbf{x_i})$ 是最小二乘的残差，那么最小二乘的最终目标就是令残差和 $f(\theta)$ 最小。
$f(\theta)=\frac{1}{2} \sum_{i=1}^{m} [r\left(\mathbf{x}_{\mathbf{i}}\right)]^2$
利用用牛顿法求解 $f(\theta)$ 的最小值，需要计算其梯度向量与 Hessian 矩阵。

先求梯度向量：
$\nabla_{\theta} f=\frac{\partial f}{\partial \theta}=\sum_{i=1}^{m} r_{i} \frac{\partial r_{i}}{\partial \theta}= \left[\begin{array}{c}{\nabla_{\theta} r\left(x_{1}\right)^{T}} \\ {\nabla_{\theta} r\left(x_{2}\right)^{T}} \\ {\vdots} \\ {\nabla_{\theta} r\left(x_{m}\right)^{T}}\end{array}\right]^T \left[\begin{array}{cccc}{r\left(x_{1}\right)} \\ {r\left(x_{2}\right)} \\ {\dots} \\ {r\left(x_{m}\right)}\end{array}\right]$