最优下降法学习

最新推荐文章于 2022-11-22 17:27:34 发布

磊磊哈哈

最新推荐文章于 2022-11-22 17:27:34 发布

阅读量311

点赞数

原文链接：https://zhuanlan.zhihu.com/p/32709034

版权

SLAM十四讲专栏收录该内容

37 篇文章 8 订阅

订阅专栏

原理

设目标函数一阶连续可微
在 $x^k$ 点处对 $f (x)$ 进行泰勒展开，得到:
$\bigtriangledown f(x^k):f在点x_k处的一阶导数$
$\lambda:为步长$
$f(x^k)-f(x^k+tp^k)=-\lambda\bigtriangledown f(x^k)^Tp^k+o(||tp^k||)$
可知在令 $p^k=-\bigtriangledown f(x^k)$ 时，函数值下降最快

步骤

$k : 迭代次数$
$x^k:表示第k步的点$
$\xi:终止误差$
$p^k:第k步的搜索方向$
$\lambda_k:第k步的步长$

确定初始点 $x^0$ ,终止误差 $\xi>0$ , $k = 0$
计算 $\bigtriangledown f(x^k)$ ,如果 $\bigtriangledown f(x^k)<\xi$ 停止迭代，否则进行第3步
令 $p^k=-\bigtriangledown f(x^k)$
求 $\lambda_k$ ,满足:
$f(x^k+\lambda_kp^k)=min_{\lambda\geq0}f(x^k+p^k)：（一般是对\lambda_k）构成的新的函数求导，得到其导数为0的点$
令 $x^{k+1}=x^k+\lambda_kp^k,k=k+1$ ,再进行第2步

一个实例

例: $minf(x)=x_1-x_2+2x_1^2+2x_1x_2+x_2^2$ ,给定初始点 $x^{(1)}=(0,0)^T,$

确定初始点 $x^0=(0,0)$ , $k = 0$
求取 $\bigtriangledown f(x^k)=\left[\begin{matrix}\frac{\partial f(x)}{\partial x_1}\\\frac{\partial f(x)}{\partial x_2}\end{matrix}\right]= \left[\begin{matrix}1+4x_1+2x_2\\ -1+2x_1+2x_2\end{matrix}\right]$
带入 $x^0$ 得到： $\bigtriangledown f(x^0)=\left[\begin{matrix}1\\-1\end{matrix}\right]$
得到 $\xi_0=|f(x^0)|=\sqrt{2}$
令 $d^{(0)}=-\bigtriangledown f(x^0)=\left[\begin{matrix}-1\\1\end{matrix}\right]$
求 $\lambda_0$ ,
(1): $x^{(0)}+\lambda d^{(0)}=\left[\begin{matrix}0\\0 \end{matrix}\right]+\lambda \left[\begin{matrix}-1\\1 \end{matrix}\right]=\left[\begin{matrix}-\lambda\\\lambda \end{matrix}\right]$ ,得到 $x_1=-\lambda,x_2=\lambda_2$
(2)将 $x_1,x_2$ 带入 $f(x)=f(x^{(0)}+\lambda d^{(1)})=(-\lambda)-\lambda+2(-\lambda)^2+2\lambda(-\lambda)+\lambda^2=\lambda^2-2 \lambda=\phi_1(\lambda)$
(3) $\phi_0(\lambda)=2\lambda-2=0$ , $\lambda_0=1$
(4) $x^{(1)}=x^{(0)}+\lambda_0 d^{(0)}=\left[\begin{matrix}0\\0 \end{matrix}\right]+1* \left[\begin{matrix}-1\\1 \end{matrix}\right]= \left[\begin{matrix}-1\\1 \end{matrix}\right]$

步长的确定方法

原理看这里
黄金分割法
缩小区间法
插值法

优缺点

在开头几步，目标函数下降较快；但在接近极小点时，收敛速度长久不理想了。特别适当目标函数的等值线为比较扁平的椭圆时，收敛就更慢了。

磊磊哈哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最优下降法学习

原理设目标函数一阶连续可微在xkx^kxk点处对f(x)f(x)f(x)进行泰勒展开，得到:▽f(xk):f在点xk处的一阶导数\bigtriangledown f(x^k):f在点x_k处的一阶导数▽f(xk):f在点xk处的一阶导数λ:为步长\lambda:为步长λ:为步长f(xk)−f(xk+tpk)=−λ▽f(xk)Tpk+o(∣∣tpk∣∣)f(x^k)-f(x^k+tp^k)=-\lambda\bigtriangledown f(x^k)^Tp^k+o(||tp^k||)f(xk)−
复制链接

扫一扫