凸优化简介24

最新推荐文章于 2024-08-16 08:06:57 发布

qq_36573282

最新推荐文章于 2024-08-16 08:06:57 发布

阅读量411

点赞数 2

文章标签：凸优化

本文链接：https://blog.csdn.net/qq_36573282/article/details/105638930

版权

本文介绍了随机优化问题的基本形式，并详细讨论了样本平均近似（Sample Average Approximation）方法，包括其理论基础和渐进性质。此外，还深入探讨了随机梯度下降（Stochastic Gradient Descent）算法，分析了其收敛性和在解决随机优化问题中的应用。

摘要由CSDN通过智能技术生成

文章目录

样本平均近似(Sample Average Approximation)与随机梯度下降(Stochastic Gradient Descent)

样本平均近似(Sample Average Approximation)与随机梯度下降(Stochastic Gradient Descent)

1. 随机优化的基本形式

随机优化问题通常为如下形式：
$\min\limits_{x\in X}\left\{f(x)\triangleq E_{\xi}[F(x,\xi)]\right\}$
其中，函数 $F(x,\xi)$ 包含了决策变量或者向量 $x$ ，以及一个随机的变量或向量 $\xi$ 。随机变量 $\xi$ 是在 $\Omega\subseteq \mathbb{R}^d$ 上服从某个分布 $P$ 的。期望的值为 $\mathbb{E}_\xi[F(x,\xi)]=\int_{\xi\in \Omega}F(x,\xi)dP(\xi)$ 。
例子：报纸供应商需要决定每天的库存，满足需求的同时最大化利润。假设库存的报纸的数量 $q$ 是决策变量，每份报纸的购进价格为 $c$ ，每份售出报纸价格为 $p$ ，用 $D$ 表示顾客购买的报纸的数量。则模型为：
$\max\limits_{q}\mathbb{E}_{D}[p\times min(q,D)-c\times q]$
考虑 $c$ 是某个常量，该模型中的 $D$ 对应 $\xi$ ，为某个随机变量， $q$ 是决策变量对应标准模型中的 $x$ 。
经验风险最小化
在机器学习算法中，损失函数定义为 $l (f (x), y)$ ，根据随机优化问题的形式定义为：
$\min\limits_{f\in \mathcal{F}}E_{x,y}[l(f(x),y)]$

2. 样本平均近似(Sample Average Approximation)

解决随机优化的一种方法是使用蒙特卡洛采样。设 $\xi_1,\dots, \xi_N$ 是独立同分布的，随机采样的变量。考虑如下的对原问题的估计：
$\min\limits_{x\in X}f^N(x)=\frac{1}{N}\sum\limits_{i=1}^{N}F(x,\xi^i)$
其中 $X$ 实在 $\mathbb{R}^n$ 上非空的闭集， $\xi$ 是随机变量，服从分布 $P$ ，在 $\mathbb{R}^d$ 上的子集 $\Xi\subset \mathbb{R}^d$ 。函数 $F:X\times \Xi\rightarrow \mathbb{R}$ 。
根据该函数的形式，可以转换为期望的形式：
$f^N(x)=\mathbb{E}_{p_N}[F(x,\xi)]$
根据大数定理， $f^N(x)$ 以1的概率收敛到 $f (x)$ 当 $N\rightarrow \infty$ 。因为 $\mathbb{E}[f^N(x)]=f(x)$ ， $f^N(x)$ 是 $f (x)$ 的无偏估计。
因此，可以认为当 $N\rightarrow \infty$ 的时候，使用样本平均估计得到的最优值收敛到对应的原始问题的最优值。

定理：假设有一个紧凑(compact)的集合 $C\subset \mathbb{R}^n$ ，并且：

原始问题的最优解的集合 $X_*$ 是非空的，并且包含在 $C$ 内；

函数 $f (x)$ 是有限的，并且在 $C$ 内是连续的；

当 $N\rightarrow \infty$ 的时候， $f^N(x)$ 以1的概率收敛到 $f (x)$ ，对于 $x\in C$ ；

当 $N$ 足够大的时候，集合 $X_*^{n}$ 是非空的概率为1， $X_*^n\subset C$
那么当 $N\rightarrow \infty$ 的时候， $f_*^{N}\rightarrow f_*$ 以及 $\mathbb{D}(X_*^{N}-X_*)\rightarrow0$ 的概率为1。

样本平均近似方法的最优值的渐进性(Asymptotics)为：

对于 $\widetilde{x}\in X$ ，期望值 $\mathbb{E}[F(\widetilde{x},\xi^2)]$ 是有限的；
存在一个可衡量的函数 $C:\Xi\rightarrow \mathbb{R}_{+}$ ， $\mathbb{E}[C(\xi^2)]$ 是有限的，并且 $|F(x,\xi)-F(x',\xi)|\leq C(\xi)\|x-x'\|$ 对于所有的 $x,x'\in X, \xi \in \Xi$ 成立。