凸优化简介3

最新推荐文章于 2021-05-26 10:29:17 发布

qq_36573282

最新推荐文章于 2021-05-26 10:29:17 发布

阅读量373

点赞数

文章标签：凸优化

本文链接：https://blog.csdn.net/qq_36573282/article/details/104896232

版权

本文介绍了非线性优化中的松弛思想，通过一阶和二阶近似来寻找局部最小值。一阶近似利用泰勒公式探讨了梯度的性质，证明了方向−▽f(x)是最优下降方向；二阶近似讨论了Hessian矩阵及其对局部最小点的影响，展示了变分不等式在优化中的应用。

摘要由CSDN通过智能技术生成

文章目录

松弛与近似

松弛与近似

一般情况下，非线性优化的最简单目标是找到一个可微函数的局部最小。要保证最小化过程的收敛，需要遵循一些特别的原则。
大部分的非线性优化的方法基于松弛的思想，如果序列 $\{\alpha_{k}\}^{\infty}_{k=0}$ 中， $\alpha_{k+1} \leq \alpha_{k}, \forall{k} \geq 0.$ 则改序列称为一个松弛序列。
因此，对于一个简单的无约束最小化问题 $min_{x\in \mathbb{R^n}}f(x)$ ，其中函数 $f (x)$ 是一个光滑函数，为了求解，产生一个松弛序列 $\{f(x_k)\}^{\infty}_{k=0}$ ，其中 $f(x_{k+1}) \leq f(x_k),k=0,1,\dots$ 。函数 $f (x)$ 在 $\mathbb{R}^n$ 上是有界单调下降的，因此是收敛的。
在非线性优化中，通常是使用基于该函数的导数来使用局部的一阶和二阶逼近。

1. 一阶近似

首先另函数 $f (x)$ 在 $x=\widetilde{x}$ 处是可微的，那么根据泰勒展开公式得到 $f(y)=f(\widetilde{x})+\langle \bigtriangledown f(\widetilde{x}),y-\widetilde{x}\rangle + o(\|y-\widetilde{x}\|_{2})$ 。其中最后的余项 $o (r)$ 是一个 $\geq 0$ 的函数，且满足 $lim_{r\rightarrow0}(\frac{1}{r}o(r))=0$ 。公式中的 $\langle \rangle$ 符号内部两个项相乘的符号。
对于 $n$ 维空间上的函数，设在点 $y_i=\widetilde{x}+\epsilon e_i$ ，其中 $e_i$ 是在 $\mathbb{R}^n$ 上的第 $i$ 个坐标向量，取极限 $\epsilon \rightarrow{0}$ ，梯度的表达式为 $\bigtriangledown f(x)=(\frac{\partial f(x)}{\partial x^{(1)}},\dots, \frac{\partial f(x)}{\partial x^{(n)}})^T$ 。设函数的层集(level set)记为 $\mathfrak{L}_f(\alpha)=\{x\in \mathbb{R}^n| f(x) \leq \alpha\}$ ，记在 $\widetilde{x}$ 上与层集 $\mathfrak{L}_{f}(f(\widetilde{x}))$ 相切方向的集合为 $S_f(\widetilde{x})=\{s\in \mathbb{R}^n | s=lim_{y_k \rightarrow \widetilde{x}, f(y_k)=f(\widetilde{x})}\frac{y_k-\widetilde{x}}{\|y_k-\widetilde{x}\|}\}$