机器学习训练算法九(高斯牛顿法)

最新推荐文章于 2023-06-20 14:19:07 发布

黎明鱼儿

最新推荐文章于 2023-06-20 14:19:07 发布

阅读量764

点赞数

分类专栏： matlab 机器学习算法文章标签：机器学习算法 matlab

本文链接：https://blog.csdn.net/u013106652/article/details/122393551

版权

算法同时被 3 个专栏收录

14 篇文章 5 订阅

订阅专栏

机器学习

13 篇文章 0 订阅

订阅专栏

matlab

11 篇文章 2 订阅

订阅专栏

连续函数的最优化方法-高斯牛顿法

1、介绍
2、数学原理
3、Matlab程序

1、介绍

高斯牛顿法针对最小二乘问题，采用一定的方法对牛顿法中的黑塞矩阵进行近似，从而简化了计算量(注意：只有最小二乘问题才能使用高斯牛顿法)。
$\frac{1}{2} \begin{Vmatrix} L(X) \end{Vmatrix}^2 \qquad (公式34)$
$\underset{X}{\min}F(X) \qquad (公式35)$

2、数学原理

高斯牛顿法与牛顿法不同之处在于，不对目标函数 $F (X)$ 进行泰勒展开，而是对残差函数 $L (X)$ 在 $X=X_k$ 处进行不含皮亚诺余项一阶泰勒展开，可推得：
$G(\Delta X_k)\stackrel{\mathrm{def}}{=} F(X_k+\Delta X_k)\approx \frac{1}{2} \begin{Vmatrix} \\ L(X_k)+\underbrace{J(X_k)}_{L}{^T} \Delta X_k \end{Vmatrix}^2 \qquad (公式36)$
公式36中 $\underbrace{J(X_k)}_{L}$ 函数 $L(X_k)$ 的雅可比矩阵。
该表达式中 $F(X_k+\Delta X_k)$ 、 $L(X_k)$ 是一个常数， $\underbrace{J(X_k)}_{L}{^T}$ 是一个常数矩阵， $\Delta X_k$ 是一个变量矩阵，即函数 $G(\Delta X_k)$ 是以 $\Delta X_k$ 为自变量的二次函数。综上所述，当函数 $G(\Delta X_k)$ 的一阶导数为0的时候，函数 $G(\Delta X_k)$ 取得极值，可推得：
$G'_{\Delta X_k}(\Delta X_k)=0 \qquad (公式37)$
由公式 36 和公式 37 可推得：
$L(X_k) \underbrace{J(X_k)}_{L} + \underbrace{J(X_k)}_{L} \underbrace{J(X_k)}_{L}{^T} \Delta X_k \qquad (公式38)$
即：
$\sum_{i=1}^m ( L_i(X_k) \underbrace{J(X_k)}_{L_i} + \underbrace{J(X_k)}_{L_i} \underbrace{J(X_k)}_{L_i}{^T} \Delta X_k ) \qquad (公式39)$
设:由公式38结合公式26结构形式,可近似推得函数 $F (X)$ 的黑塞矩阵 $\underbrace{H(X_k)}_{F}$ 和雅克比矩阵 $\underbrace{J(X_k)}_{F}$ ：
$\underbrace{H(X_k)}_{F} \stackrel{\mathrm{def}}{\approx} \underbrace{J(X_k)}_{L} \underbrace{J(X_k)}_{L}{^T} \qquad (公式40)$
$\underbrace{J(X_k)}_{F} \stackrel{\mathrm{def}}{\approx} L(X_k) \underbrace{J(X_k)}_{L} \qquad (公式41)$
由公式 38、公式 40、公式 41 可推得：
$\Delta X_k=- {\underbrace{H(X_k)}_{F}}^{-1} \underbrace{J(X_k)}_{F} \qquad (公式42)$
由公式 42 可推得目标函数 $F (X)$ 的最优化迭代公式：
$X_{k+1}\stackrel{\mathrm{def}}{=} X_{k} -{\underbrace{H(X_k)}_{F}}^{-1} \underbrace{J(X_k)}_{F} \qquad (公式43)$