【最优化理论】03-无约束优化

最新推荐文章于 2024-02-06 11:53:42 发布

暖焱

最新推荐文章于 2024-02-06 11:53:42 发布

阅读量2k

点赞数 10

分类专栏：最优化理论文章标签：最优化理论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guai7guai11/article/details/127846954

版权

最优化理论专栏收录该内容

5 篇文章 6 订阅

订阅专栏

无约束优化

无约束优化问题
无约束优化问题的应用
无约束优化问题的最优性条件
无约束优化问题解法：迭代下降算法
- 迭代下降算法基本思想
- 迭代下降算法步骤
迭代下降算法中-如何从当前点迭代到下一个点？
常用迭代下降算法
无约束优化算法总结

无约束优化问题

$\underset{x\in R^n}{min} f(x)$

无约束优化问题的应用

约束优化问题转换为无约束优化问题求解

无约束优化问题的最优性条件

无约束-凸函数-最优性条件（充要）

在这里插入图片描述

无约束-一般函数-最优性条件

必要条件

一阶必要条件：梯度为0

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二阶必要条件：hessian矩阵半正定

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

充分条件

二阶充分条件：梯度为0 + hessian矩阵正定 = 严格最优

在这里插入图片描述

无约束优化问题解法：迭代下降算法

迭代下降算法基本思想

在这里插入图片描述

迭代下降算法步骤

在这里插入图片描述

选取搜索方向是最关键的一步，各种算法的区别主要在于确定搜索方向的方法不同。

迭代下降算法中-如何从当前点迭代到下一个点？

1 何时终止？（终止条件/收敛准则）

判断梯度是否接近0， $\varepsilon$ 是一个非常小接近于0的数。
在这里插入图片描述

2 如何确定下降方向？

待补充

梯度反方向

Zoutendijk定理（为保证全局收敛下降方向应该遵循的准则）

在这里插入图片描述

$||\Delta f(x^k)||\rightarrow 0$ 表示全局收敛

在这里插入图片描述

有界即 $||\Delta f(x^k)||\rightarrow 0$ 表示全局收敛

3 如何确定步长？

线搜索中确定步长 - 一维线搜索（一维问题）

在这里插入图片描述

在这里插入图片描述

一维线搜索闭性

一维线搜索方法

精确线搜索

在这里插入图片描述

精确线搜索方法基本框架

在这里插入图片描述

精确线搜索特点

在这里插入图片描述

精确线搜索方法

梯度为0（简单函数 - 一元二次函数）

在这里插入图片描述

试探法 - 基于搜索区间的直接搜索法（一般函数）

在这里插入图片描述

常用直接搜索法

均匀搜索法

在这里插入图片描述

黄金区间法（0.618法）

优点：每次只计算一个点的函数值。
在这里插入图片描述

基于导数信息的二分法

在这里插入图片描述

非精确线搜索 Inexact Linear Search

在这里插入图片描述

Armijo 条件 & Goldstein 法则

如果步进太小，函数值变化也小，为了避免Armijo条件步进小的问题，提出G法则。
在这里插入图片描述

4 {x^k}收敛性与收敛速度（如何判断算法优劣？）

收敛性

在这里插入图片描述

收敛速度

在这里插入图片描述

Q-收敛速率

在这里插入图片描述

在这里插入图片描述

R-收敛速率

在这里插入图片描述

收敛速度比较基准：算法在严格凸（正定）二次函数上的收敛速度（二次终止性）

二次终止性

若某个算法对于任意的正定二次函数 $f(x)=\frac {1}{2} x^TPx+Q^Tx+\delta$ ，其中P是n阶正定对称矩阵，从任意的起始点出发，都能经有限步迭代到其极小点，则称该算法具有二次终止性。

在这里插入图片描述

常用迭代下降算法

一维线搜索（Linear Search）

先确定下降方向，再确定步长。

因为线搜索先确定了方向，所以确定步长是一维问题。

在这里插入图片描述

step1 确定下降方向

step2 确定步长（一维问题）

信赖域方法（Trust Region）

先确定步长（确定一个以步长为半径的范围），再确定下降方向。

因为信赖域方确定步长前没有确定方向，所以确定步长是n维问题。

在这里插入图片描述

信赖域实际求解的时候，一般为了方便求解，约束不变，找到一个 $f(x^k+d)$ 的近似函数进行最小化。

step1 确定步长（n维问题）

step2 确定下降方向

朴素算法：坐标轴交替下降法

基本思想

选择迭代方向需要很大的计算量，为了避免选择迭代方向，直接选择坐标轴正反方向进行搜索，因为是沿坐标轴搜索，所以该过程中都是一元问题。

基本框架

在这里插入图片描述

优缺点

在这里插入图片描述

改进方法

n次坐标轴交替后插入一次线搜索

在这里插入图片描述

最速下降法（梯度下降法）

在这里插入图片描述

最速下降法框架

在这里插入图片描述

基本思想

负梯度方向也叫最速下降方向。
在这里插入图片描述
如何判断d^k是负梯度方向？
$d^k \cdot \nabla f(x^k) \le 0$

优缺点

在这里插入图片描述

最速下降法，对于严格凸二次函数，不能在有限步找到最优解，即不具备二次终止性。

在这里插入图片描述

缺点原因

在这里插入图片描述

在这里插入图片描述

经过上述推导得出：若使用精确线搜索，且迭代方向选择负梯度方向，则k处梯度与k+1处梯度内积为0，即相邻两个迭代点处梯度方向垂直。

在这里插入图片描述

牛顿法（Steepest Descent Method）

在这里插入图片描述

牛顿法算法框架

在这里插入图片描述

基本思想

在这里插入图片描述

使用二阶taylor展开式逼近当前函数，求出二阶taylor展开式的导数，并使导数为0，可以得到以下式子。

在这里插入图片描述

假设hessian矩阵正定。

在这里插入图片描述

跟 $x^{k+1}=x^k+\alpha_k d^k$ 对比，又有 $d^k=-[\nabla^2f(x^k)^{-1}\nabla f(x^k)]$ ，所以步长 $\alpha_k$ 为1。

在这里插入图片描述

问题：牛顿方向一定是下降方向吗？（hessian矩阵不正定时，特征值含0或负数）

判断是否下降方向的方法： $\nabla f(x^k)^Td^k \le 0$
在这里插入图片描述

优缺点

在这里插入图片描述

牛顿法缺点

缺点：不但要计算梯度，还要计算hessian矩阵。

在这里插入图片描述

牛顿法优点

在这里插入图片描述

严格二次凸函数使用牛顿法一次迭代可达到最优解

对于严格凸二次规划，牛顿法只需一步迭代即可得到最优解。

严格二次凸函数近似逼近函数就是其本身，一次求导使得导数为0，即可求出最优解。

在这里插入图片描述

牛顿法改进策略

在这里插入图片描述

阻尼牛顿法

在这里插入图片描述

修正牛顿法

修正迭代步长：线搜索

在这里插入图片描述

修正迭代方向：针对hessian矩阵含0特征值或负特征值的情况

在这里插入图片描述

方法一：特征值加一个正数

正数不能选太大，如果选太大，hessian矩阵的作用就会被淹没，二阶信息体现不出来。
在这里插入图片描述

方法二：0特征值或负特征值替换为正特征值

在这里插入图片描述

牛顿-最速下降法

在这里插入图片描述

牛顿法 Vs 最速下降法

在这里插入图片描述

共轭梯度法

背景知识

在这里插入图片描述

提出问题

在这里插入图片描述

若Q为对角阵，则等值线为椭圆，且长短轴平行于xy坐标轴，根据坐标交替法，两步即可找到最优解。
若Q为非对角阵，则等值线不是椭圆，长短轴不平行于xy坐标轴，不能使用坐标交替法，需要先对Q进行相似对角化（即 $Q=P^TDP$ ，也可以理解为找到x的可逆线性变换 $\hat x = Px$ ），之后按照D为对角矩阵，则等值线为椭圆，且长短轴平行于xy坐标轴，根据坐标交替法，两步即可找到 $\hat x$ 最优解，再通过 $x=P^{-1}\hat x=P^T\hat x$ ，求出x。

但是计算P需要解线性方程组，又回到了原始求解线性方程组困难的问题，所以需要找到一组向量组成矩阵S $d^0,d^1,d^2,...,d^{n-1})=S$ ，使得S跟P一样，可以对Q进行对角化。向量 $d^0,d^1,d^2,...,d^{n-1}$ 间需要满足的关系就是关于矩阵Q共轭。
在这里插入图片描述

共轭方向

在这里插入图片描述

$d^0,d^1,d^2,...,d^{n-1}$ 就是n个共轭方向。

共轭方向性质

在这里插入图片描述

共轭方向法

在这里插入图片描述

在这里插入图片描述

共轭方向法性质

在这里插入图片描述

在这里插入图片描述

特征1 ：当前点处梯度与之前每个迭代方向内积都为0

当前点处梯度与产生该点的迭代方向内积为0

原因：使用的是精确搜索步长。
在这里插入图片描述

当前点处梯度与之前的迭代方向内积都为0

在这里插入图片描述

特征2：对于一元二次严格凸函数使用共轭方向法n步可找到最优解 x^n

在这里插入图片描述

共轭梯度法（边迭代边产生迭代方向）

共轭方向法是一类方法的总称，共轭梯度法是其中一种。

边迭代边产生迭代方向，并且新产生的迭代方向要与之前的每个迭代方向共轭。

在这里插入图片描述

线性共轭梯度法

研究动机

解决维度较大的线性方程组求解问题。
在这里插入图片描述

β如何求出来的？

在这里插入图片描述

为什么公式中只有βk而没有β0~βk-1？

在这里插入图片描述

公式化简

在这里插入图片描述

为什么要进行公式化简？

因为要将共轭梯度法求解线性方程组（如一元二次函数梯度=0的超多维线性方程组）扩展到非线性方程组求解。最后的公式中，βk只包含函数梯度。
在这里插入图片描述

线性共轭梯度法的收敛性

在这里插入图片描述

线性共轭梯度法性质

在这里插入图片描述

严格二次凸函数共轭梯度法

在这里插入图片描述

一般函数的共轭梯度法

在这里插入图片描述

非线性共轭梯度法（解决一般函数）

在这里插入图片描述

FR共轭梯度法基本步骤

在这里插入图片描述

迭代延续的方法

在这里插入图片描述

一般情形下的FR共轭梯度法

在这里插入图片描述

一些说明

在这里插入图片描述

n步重启策略：把n步作为一轮，每搜索一轮之后，取一次最速下降方向，开始下一轮。

实际使用中n步重启策略的原因

1 迭代n次后，d⁰对于dⁿ 没有太大作用，将这部分信息清洗掉。
2 在一轮中某次迭代，可能落到类似于一元二次函数的区域，重启可以使用线性共轭梯度法的优点。

无约束优化算法总结

在这里插入图片描述

关注

10
点赞
踩
53

收藏

觉得还不错? 一键收藏
0
评论
【最优化理论】03-无约束优化

最优化理论无约束优化
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。