凸优化简介11

最新推荐文章于 2021-10-27 21:46:15 发布

qq_36573282

最新推荐文章于 2021-10-27 21:46:15 发布

阅读量203

点赞数

文章标签：凸优化

本文链接：https://blog.csdn.net/qq_36573282/article/details/105047198

版权

本文介绍了在凸优化问题中，如何利用梯度下降的加速方法提高求解效率。具体阐述了Nesterov的加速梯度下降法，并通过引理分析了序列的收敛性和估计序列的构造。此外，还提供了优化方法的一般过程，包括步长计算、yk和xk+1的选取等关键步骤。

摘要由CSDN通过智能技术生成

文章目录

梯度下降加速

梯度下降加速

考虑一个无约束的最小化问题： $\min\limits_{x\in \mathbb{R}^N}f(x)$ ，其中函数 $f$ 是强凸的： $f\in \mathfrak{F}_{\mu,L}^{1,1}(\mathbb{R}^n), \mu \geq 0$ ，并且该函数的梯度是 Lipschitz连续的。
梯度方法构造了一个松弛序列 $f(x_{k+1}) \leq f(x_k)$ ，但是，在某些情况下，最佳的方案不依赖于这样的松弛方案。
Nesterov 在1983年发现了对光滑函数的加速梯度下降方法，并在2004年和2007年将加速方法分别推广到非光滑目标函数和组合函数。Nesterov的方法可以归结为一种称为 估计序列的方法。

定义：一对序列 $\{\phi_k(x)\}_{k=0}^{\infty}$ 和 $\{\lambda_k\}_{k=0}^{\infty}$ ， $\lambda_k\geq0$ 称为函数 $f (x)$ 的一个估计序列，如果 $\lambda_k\rightarrow0$ 。且对于任意的 $x\in \mathbb{R}^n$ 和所有的 $\geq 0$ ，有： $\phi_k(x)\leq (1-\lambda_k)f(x)+\lambda_k\phi_0(x)$ .

引理1：如果对于某个序列 ${x_k\}$ ，我们有 $f(x_k)\leq \phi_k^*\equiv \min\limits_{x\in \mathbb{R}^n}\phi_k(x)$ ，那么 $f(x_k)-f^*\leq \lambda_k[\phi_0(x^*)-f^*]\rightarrow0$

证明：根据已知条件以及上面的定义得到 $f(x_k)\leq \phi_{k}^*=\min\limits_{x\in \mathbb{R}^n}\phi_k(x)\leq \min\limits_{x\in \mathbb{R}^n}[(1-\lambda_k)f(x)+\lambda_k\phi_0(x)]\\ \leq (1-\lambda_k)f(x^*)+\lambda_k\phi_0(x^*)$ .
应用上面的引理可以得到序列 $\{\lambda_k\}$ 的收敛率，但是如何构造估计序列以及如何满足引理。

引理2：假设 1. $f\in \mathfrak{F}_{\mu,L}^{1,1}(\mathbb{R}^n)$ ;
2. $\phi_0(x)$ 是一个在 $\mathbb{R}^n$ 上的任意函数；
3. $\{y_k\}_{k=0}^{\infty}$ 是一个在 $\mathbb{R}^n$ 上的任意序列；
4. $\{a_k\}_{k=0}^{\infty}$ ： $a_k\in (0,1),\sum\limits_{k=0}^{\infty}a_k=\infty$
5. $\lambda_0=1$
那么，序列对 $\{\phi_k(x)\}_{k=0}^{\infty},\{\lambda_k\}^{\infty}_{k=0}$ 由 $k$ 递归定义： $\lambda_{k+1}=(1-a_k)\lambda_k$ , $\phi_{k+1}(x)=(1-a_k)\phi_k(x)+a_k[f(y_k)+\langle \nabla f(y_k),x-y_k\rangle+\frac{\mu}{2}\|x-y_k\|^2]$ 是一个估计序列