机器学习训练算法七(牛顿下降法)

最新推荐文章于 2023-01-08 23:03:03 发布

黎明鱼儿

最新推荐文章于 2023-01-08 23:03:03 发布

阅读量773

点赞数 1

分类专栏：算法机器学习 matlab 文章标签：算法机器学习 matlab

本文链接：https://blog.csdn.net/u013106652/article/details/122310823

版权

算法同时被 3 个专栏收录

15 篇文章 6 订阅

订阅专栏

机器学习

14 篇文章 0 订阅

订阅专栏

matlab

11 篇文章 2 订阅

订阅专栏

本文介绍了牛顿下降法作为连续函数最优化的一种高效方法。该方法通过求解目标函数的一阶导数为零的点来逼近最小值，利用二阶泰勒展开和海森矩阵来迭代更新参数。在数学原理部分，详细阐述了从泰勒公式到求解优化迭代公式的推导过程。此外，还提供了Matlab程序链接，供读者实践和理解牛顿下降法的计算步骤。

摘要由CSDN通过智能技术生成

1、介绍

通过求解目标函数的一阶导数为0时的参数，进而求出目标函数最小值时的参数。收敛速度很快。海森矩阵的逆在迭代过程中不断减小，可以起到逐步减小步长的效果

2、数学原理

目标函数 $F (X)$ 在 $X=X_k$ 处的不含皮亚诺余项的二阶泰勒公式如下：
$G(\Delta X_k)\stackrel{\mathrm{def}}{=} F(X_k+\Delta X_k)\approx F(X_k)+ \underbrace{J(X_k)}_{F}{^T} \Delta X_k ＋\frac{1}{2} {\Delta X_k}^T \underbrace{H(X_k)}_{F} \Delta X_k \qquad (公式24)$
该表达式中 $F(X_k+\Delta X_k)$ 、 $F(X_k)$ 是一个常数， $\underbrace{J(X_k)}_{F}{^T}$ 、 $\underbrace{H(X_k)}_{F}$ 是一个常数矩阵， $\Delta X_k$ 是一个变量矩阵，即函数 $G(\Delta X_k)$ 是以 $\Delta X_k$ 为自变量的二次函数。综上所述，当函数 $G(\Delta X_k)$ 的一阶导数为0的时候，函数 $G(\Delta X_k)$ 取得极值，可推得：
$G'_{\Delta X_k}(\Delta X_k)=0 \qquad (公式25)$
由公式 24 和公式 25 可推得：
$\underbrace{J(X_k)}_{F} + \underbrace{H(X_k)}_{F} \Delta X_k \qquad (公式26)$
由公式 26 可推得：
$\Delta X_k=- {\underbrace{H(X_k)}_{F}}^{-1} \underbrace{J(X_k)}_{F} \qquad (公式27)$
由公式 27 可推得目标函数 $F (X)$ 的最优化迭代公式：
$X_{k+1}\stackrel{\mathrm{def}}{=} X_{k} -{\underbrace{H(X_k)}_{F}}^{-1} \underbrace{J(X_k)}_{F} \qquad (公式28)$
令：牛顿方向为 $N(X_k)\stackrel{\mathrm{def}}{=}-{\underbrace{H(X_k)}_{F}}^{-1}\underbrace{J(X_k)}_{F}$ ，由公式28可推得：
$X_{k+1}\stackrel{\mathrm{def}}{=} X_{k}+N(X_k) \qquad (公式29)$