无约束最优化方法

无约束最优化问题
m i n f ( x ) f : R n − > R ( 1 ) 求 解 ( 1 ) , 就 是 找 到 R n 中 的 一 点 x ∗ , 使 得 ∀ x ∈ R n , 均 有 f ( x ∗ ) ≤ f ( x ) , 称 x ∗ 为 ( 1 ) 的 全 局 极 小 点 。 minf(x) \qquad f:R^n->R \qquad (1) \quad \quad \\\quad \quad \newline 求解(1),就是找到R^n中的一点x^*,使得∀x∈R^n,\quad \quad \\\quad \quad \newline 均有f(x^*)≤f(x),称x^*为(1)的全局极小点。 \newline minf(x)f:Rn>R(1)(1)Rnx使xRnf(x)f(x)x(1)

最速下降法

在这里插入图片描述

  • 收敛性定理:设f连续可微,水平集L={x | f(x) ≤ f(x^ 1)},则最速下降法或者在有限步迭代后终止,或者得到点列{x^k},其任何聚点都是f的驻点。
  • 在收敛定理的假设下,若f 为凸函数,则最速下降法或在
    有限迭代步后达到极小点,或得到点列 其任何聚点都是
    f 的极小点

最速下降法的两个特征

  1. 相邻两次迭代的搜索方向互相正交 (锯齿现象)
  2. 对二元正定二次函数,用最速下降法产生的点列:偶数点列均在一条直线上,奇数点列也均在一条直线上,且都过最优点

最速下降法的改进:

  1. 选择不同初始点
  2. 采用不精确的一维搜索:采用非精确一维搜索求步长,
    可使相邻两个迭代点处的梯度不正交,从而改变收敛性
  3. 采用加速梯度法:由于最速下降法在极小值点附近成锯齿状,因此下降过程中搜索方向可取
    d k = x k − x k − 2 d^k = x^k-x^{k-2} dk=xkxk2
    下两步继续用最速下降法,即负梯度方向


Newton法

在这里插入图片描述步骤3中的搜房方向,可通过求解下列方程组得到
▽ 2 f ( x k ) d k + ▽ f ( x k ) = 0 ▽^2f(x^k)d^k+▽f(x^k)=0 2f(xk)dk+f(xk)=0

  • 当 f 为正定二次函数时,用Newton法从任意初始点可一步
    迭代达到极小点。
  • 二次收敛性:从任意初始点出发,经有限次迭代总可以达到正定二次函
    数的极小点,称这样的算法具有二次收敛性

Newton法的优点

  1. 当初始点离极小点很近时,算法收敛速度快
  2. 算法简单,不需要进行一维搜索
  3. 对正定二次函数,迭代一次就可得到极小点

Newton法的缺点

  1. 对多数问题算法不具有全局收敛性
  2. 每次迭代都要计算Hesse矩阵,计算量大
  3. 每 次 迭 代 都 要 计 算 ( ▽ 2 f ( x k ) ) − 1 或 求 解 方 程 组 ▽ 2 f ( x k ) d + ▽ f ( x k ) = 0 每次迭代都要计算(▽^2f(x^k))^{-1} \\ \quad \newline 或求解方程组▽^2f(x^k)d+▽f(x^k)=0 (2f(xk))12f(xk)d+f(xk)=0

( ▽ 2 f ( x k ) ) − 1 可 能 不 存 在 方 程 组 是 奇 异 的 , 病 态 的 ▽ 2 f ( x k ) 非 正 定 , d k 可 能 不 是 下 降 方 向 (▽^2f(x^k))^{-1}可能不存在 \\ \quad \newline方程组是奇异的,病态的 \\ \quad \newline ▽^2f(x^k)非正定,d^k可能不是下降方向 (2f(xk))12f(xk)dk

  1. 收敛于鞍点或极大点的可能性并不小

Newton法的改进

针对缺点(1) 对多数算法不具有全局收敛性,和 (4) 收敛于鞍点或极大点的可能性并不小,步长不取固定值1,而是采用精确一维搜索找最佳步长λk,这就是阻尼牛顿法
m i n f ( x k + λ d k ) minf(x^k+λd^k) minf(xk+λdk)


Newton法的近一步改进
针对缺点(2)每次计算Hesse矩阵
在这里插入图片描述在这里插入图片描述在这里插入图片描述



共轭梯度法

在这里插入图片描述

共轭方向的性质

在这里插入图片描述



共轭方向法步骤
在这里插入图片描述在这里插入图片描述


在这里插入图片描述



FR共轭梯度法
a k = ∣ ∣ g k + 1 ∣ ∣ 2 ∣ ∣ g k ∣ ∣ 2 a_k=\frac{||g_{k+1}||^2}{||g_k||^2} ak=gk2gk+12



FR共轭梯度法的计算步骤

在这里插入图片描述
在这里插入图片描述



变尺度法

牛顿法和阻尼牛顿法收敛速度很快,但需要计算Hesse矩阵的逆,计算量大
为减少计算量,用一个n阶对称正定矩阵Hk近似代替Hesse矩阵的逆,搜索方向为pk = -Hkgk,由此产生的方法称为变尺度法,Hk为尺度矩阵,这是一种拟牛顿法


变尺度法的计算步骤

在这里插入图片描述
在这里插入图片描述

  • 构造Hk的原则
    1. 拟牛顿性质
    2. 二次收敛性
    3. 稳定性


Hk的构造策略

  1. H1为任意一个n阶对称正定矩阵,通常选取n阶单位矩阵I
  2. 然后通过修正Hk,给出Hk+1
    H k + 1 = H k + △ H k H_{k+1} = H_k+△H_k Hk+1=Hk+Hk
    构造不同的Hk,也就是构造不同的修正矩阵△Hk,得到不同的变尺度法



DFP算法

DFP算法构造的Hk:对称正定满足拟牛顿性质
H k + 1 △ g k = △ x k H k + 1 = H k + α k u k ( u k ) T + β k v k ( v k ) T α k 、 β k 是 常 数 , u k 、 v k 是 n 维 列 向 量 , H 1 是 对 称 正 定 的 矩 阵 H k + 1 满 足 拟 牛 顿 性 质 , H k + 1 △ g k = △ x k α k u k ( u k ) T △ g k + β k v k ( v k ) T △ g k = △ x k − H k △ g k u k = △ x k , v k = H k △ g k 令 α k = 1 ( △ x k ) T △ g k , β k = − 1 ( △ g k ) T H k △ g k H_{k+1}△g_k = △x_k \\ \\ \quad \quad \newline H_{k+1} = H_k +α_ku^k(u^k)^T+β_kv^k(v^k)^T \\ \\\quad \quad \newline α_k、β_k是常数,u^k、v^k是n维列向量,H_1是对称正定的矩阵 \\ \\\quad \quad \newline H_{k+1}满足拟牛顿性质,H_{k+1}△g_k=△x_k \\ \\\quad \quad \newline α_ku^k(u^k)^T△g_k +β_kv^k(v^k)^T△g_k=△x_k-H_k△g_k\\ \\\quad \quad \newline u^k=△x_k,v^k=H_k△g_k\\ \\\quad \quad \newline 令α_k = \frac{1}{(△x_k)^T△g_k},β_k=-\frac{1}{(△g_k)^TH_k△g_k} Hk+1gk=xkHk+1=Hk+αkuk(uk)T+βkvk(vk)TαkβkukvknH1Hk+1Hk+1gk=xkαkuk(uk)Tgk+βkvk(vk)Tgk=xkHkgkuk=xkvk=Hkgkαk=(xk)Tgk1βk=(gk)THkgk1


在这里插入图片描述



DFP算法的计算步骤

在这里插入图片描述
在这里插入图片描述



在这里插入图片描述

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值