最优化之最速下降

最新推荐文章于 2024-01-04 00:03:44 发布

糖焖莲子_

最新推荐文章于 2024-01-04 00:03:44 发布

阅读量2.7k

点赞数 2

文章标签：最优化梯度下降最速下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QinxiEva/article/details/89636715

版权

第四章无约束优化方法

4.2 最速下降法

最速下降法的基本思想：当当前点 $x_k$ 处的梯度不为0时（或不满足精度要求时），从当前点 $x_k$ 出发，沿负梯度方向 $-\nabla f(x_{k})$ 前进到下一个点 $x_{(k+1)}$ 。

4.2.1 算法实现

考虑无约束优化问题:

$m i n f (x)$

其中 $f$ 具有一阶连续偏导数。

最速下降算法：
输入：函数 $f$ ： $R^n$ : $\rightarrow$ $R$ ,具有一阶连续偏导数，初始点 $x^{(0)}$ 允许误差 $\epsilon$ 。
输出：满足精度要求的点 $\overline{x}$ 。
    1 $k\gets 1$
    2 $||\nabla f(x^{(k)})|| > \epsilon$ $d o$
    3    下降方向 $d^{k}\gets −\nabla f(x^{(k)})$ 。
    4    计算步长因子 $\alpha_{k}$ 。
    5    $x^{(k+1)} \gets d^{(k)}+\alpha_{k}d^{(k)}$ 。
    4    $k\gets k+1$
    5 $e n d w h i l e$
    6 $r e t u r n$ $\bar{x}\gets x^{(k)}$

4.2.2 例题讲解

Example :用最速下降法解 $f(x)=2x^{2}_{1}+x^{2}_{2}$ ，初始点 $x^{(1)}=\begin{pmatrix}1 \\ 1\end{pmatrix}$ ， $\epsilon=0.1$ 。
解：目标函数在 $x$ 处的梯度为：

$\nabla f(x)=\begin{pmatrix}4x_{1}\\ 2x_{2}\end{pmatrix}$

第1次迭代：

$\nabla f(x^{(1)})=\begin{pmatrix}4\\ 2\end{pmatrix}$ ，其模为 $\sqrt{4^{2}+2^{2}}>0.1$

令搜索方向 $d^{(1)}=-(\nabla^{}f(x^{(1)}))=\begin{pmatrix}-4\\ -2\end{pmatrix}$

从 $x^{(1)}$ 出发，沿方向 $d^{(1)}$ 进行一维搜索，求步长 $\alpha_{1}$ ，即求解 $min_{\alpha>0}f(x^{(1)}+\alpha d^{(1)})$ ,其中，

$f(x^{(1)}+\alpha d^{(1)})$ = $f(\begin{pmatrix}1\\ 1\end{pmatrix}+\alpha \begin{pmatrix}-4\\ -2\end{pmatrix}) = 2(1-4\alpha)^{2}+(1-2\alpha)^{2}$

求导解出最小值点为 $\alpha_1=\frac{5}{18}$

因此，在方向 $d^{(1)}$ 处问题的极小点为 $x^{(2)}=d^{(1)}+\alpha_{1}d^{(1)}=\begin{pmatrix}-1/9\\ 4/9\end{pmatrix}$

第2次迭代：

$\nabla f(x^{(2)})=\begin{pmatrix}-4/9\\ 8/9\end{pmatrix}$ ，其模为 $\sqrt{(-4/9)^{2}+(8/9)^{2}}>0.1$

令搜索方向 $d^{(2)}=-(\nabla^{}f(x^{(2)}))=\begin{pmatrix}4/9\\ -8/9\end{pmatrix}$

从 $x^{(2)}$ 出发，沿方向 $d^{(2)}$ 进行一维搜索，求步长 $\alpha_{2}$ ，即求解 $min_{\alpha>0}f(x^{(2)}+\alpha d^{(2})$ ,其中，

$f(x^{(2)}+\alpha d^{(2)})$ = $f(\begin{pmatrix}-1/9\\ 4/9\end{pmatrix}+\alpha \begin{pmatrix}4/9\\ -8/9\end{pmatrix})$

求导解出最小值点为 $\alpha_1=\frac{5}{12}$

因此，在方向 $d^{(2)}$ 处问题的极小点为 $x^{(3)}=d^{(2)}+\alpha_{2}d^{(2)}=\begin{pmatrix}2/27\\ 2/27\end{pmatrix}$

以此类推，共四次迭代，最终得到近似解 $\bar{x}=\frac{2}{243}\begin{pmatrix}-1\\ 4\end{pmatrix}$

实际上，问题的最优解为 $x^{\star}=\begin{pmatrix}0\\ 0\end{pmatrix}$

在这里插入图片描述

4.2.3 最速下降法的锯齿现象

在最速下降法中，相邻的搜索方向垂直或近似垂直，这成为“锯齿现象”。
在这里插入图片描述

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。