一:最优化问题的一般形式
最优化问题的一般形式:可以描述为如下,理解为在 x ∈ χ x\in \chi x∈χ的约束下,最小化(当然最大化就是 m a x max max)问题 f ( x ) f(x) f(x)
m i n f ( x ) , s . t . x ∈ χ ① min\quad f(x), \quad s.t.\quad x\in \chi\quad \quad① minf(x),s.t.x∈χ①
注意:
-
x x x= ( x 1 , x 2 , . . . , x n ) T ∈ R n (x_{1},x_{2},...,x_{n})^{T}\in \R^{n} (x1,x2,...,xn)T∈Rn是决策变量
-
f f f: R n → R \R^{n}\rightarrow \R Rn→R是目标函数
-
χ ⊆ R n \chi \subseteq \R_{}^{n} χ⊆Rn是可行域;可行域包含的点称之为可行解;当 χ = R n \chi =\R^{n} χ=Rn时,此时称为无约束优化问题
-
集合 χ \chi χ通常可以由约束函数 c i ( x ) c_{i}(x) ci(x): R n → R \R^{n}\rightarrow \R Rn→R, i = 1 , 2 , . . . , m + l i=1,2,...,m+l i=1,2,...,m+l表达为如下形式
-
在所有满足约束条件的决策变量中,使目标函数取最小值的变量 x ∗ x^{*} x∗称为优化问题①的最优解,即对任意 x ∈ χ x\in \chi x∈χ都有 f ( x ) ≥ f ( x ∗ ) f(x)\geq f(x^{*}) f(x)≥f(x∗)
-
如果在集合 χ \chi χ上,函数 f f f的最小或最大值不存在,则可以关心其下界或上界,也即 i n f f inf\quad f inff或 s u p f sup\quad f supf
因此,总的来说,最优化问题主要涉及以下三个要素
- 决策变量 x x x= ( x 1 , x 2 , . . . , x n ) T ∈ R n (x_{1},x_{2},...,x_{n})^{T}\in \R^{n} (x1,x2,...,xn)T∈Rn:表示我们在最优化问题中要求解的变量
- 目标函数 f f f( R n → R \R^{n}\rightarrow \R Rn→R):表示我们需要最大化或最小化的表达式
- 约束函数 c i c_{i} ci( R n → R \R^{n}\rightarrow \R Rn→R):表示我们需要满足的等式或不等式条件
比如下面的最优化问题
- 决策变量 x ∈ R x\in \R x∈R
- 目标函数 f ( x ) = 1 2 ( x − 1 ) 2 + 1 f(x)=\frac{1}{2}(x-1)^{2}+1 f(x)=21(x−1)2+1
- 约束条件
m i n x ∈ R 1 2 ( x − 1 ) 2 + 1 \mathop{min}\limits_{x\in R}\frac{1}{2}(x-1)^{2}+1 x∈Rmin21(x−1)2+1
这个问题,只需画出该函数图像便可解决
二:一个简单例子
如下是一个男女双方相互匹配相亲的例子,双方两两匹配,故可以形成一个匹配矩阵,其中每个元素为 c i j c_{ij} cij,表示男生 i i i和女生 j j j的匹配度
为了使相亲结果更好就要使总的匹配度高,所以这时一个可以用最优化来解决的问题
首先定义决策变量 x i j x_{ij} xij,取值及相应含义如下
x i j x_{ij} xij | 含义 |
---|---|
1 | 男生 i i i和女生 j j j匹配 |
0 | 男生 i i i和女生 j j j不匹配 |
假设有 N N N位男生和 N N N位女生,那么该优化问题可以描述为
m a x ∑ i = 1 N ∑ j = 1 N c i j x i j max\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}c_{ij}x_{ij} maxi=1∑Nj=1∑Ncijxij
s . t . s.t. s.t.
- ∑ i = 1 N x i j = 1 , ∀ j = 1 , 2 , . . . , N \sum\limits_{i=1}^{N}x_{ij}=1, \quad \forall j=1,2,...,N \quad i=1∑Nxij=1,∀j=1,2,...,N:限制一个男生匹配一个女生
- ∑ j = 1 N x i j = 1 , ∀ i = 1 , 2 , . . . , N \sum\limits_{j=1}^{N}x_{ij}=1, \quad \forall i=1,2,...,N \quad j=1∑Nxij=1,∀i=1,2,...,N:限制一个女生匹配一个男生
三:最优化问题分类
(1)有约束和无约束
无约束:无约束优化问题的决策变量没有约束条件限制,也即可行集合 χ = R n \chi=\R^{n} χ=Rn
例如
m i n x ∈ R 1 2 ( x − 1 ) 2 + 1 \mathop{min}\limits_{x\in R}\frac{1}{2}(x-1)^{2}+1 x∈Rmin21(x−1)2+1
有约束:是指带有约束条件的问题
- 从某种程度上来讲,约束优化问题就是无约束优化问题,因为可以将约束罚到目标函数上转为无约束问题
例如
m i n x ∈ R 1 2 ( x − 1 ) 2 + 1 \mathop{min}\limits_{x\in R}\frac{1}{2}(x-1)^{2}+1 x∈Rmin21(x−1)2+1
s . t . s.t. s.t.
x ≥ 2 x\geq2 x≥2
(2)连续优化和离散优化
连续优化:连续优化问题是指决策变量所在的可行集合是连续的,例如平面、区间等
- 在连续优化问题中,基于决策变量取值空间以及约束和目标函数的连续性,我们可以从一个点处目标和约束函数的取值来估计该点可行邻域内的取值情况,进一步可以根据邻域内的取值信息来判断该点是否最优。但是离散优化问题做不到
例如
m i n x ∈ R ( x − 1.4 ) 2 + 1 \mathop{min}\limits_{x\in R}(x-1.4)^{2}+1 x∈Rmin(x−1.4)2+1
离散优化:离散优化问题是指决策变量能在离散集合上取值,例如离散点集、整数集等
- 离散优化问题一般较连续优化问题更难求解,所以实际中离散优化问题往往可以转为一系列连续优化问题来进行求解
例如
m i n x ∈ Z ( x − 1.4 ) 2 + 1 \mathop{min}\limits_{x\in Z}(x-1.4)^{2}+1 x∈Zmin(x−1.4)2+1
(3)随机性优化和确定性优化
随机性优化:目标函数或者约束函数中涉及随机变量而带有不确定性的问题
- 随机优化问题在机器学习、深度学习以及强化学习中有着重要应用,其优化问题的目标函数是关于一个未知参数的期望的形式.因为参数的未知性,实际中常用的方法是通过足够多的样本来逼近目标函数,得到一个新的有限和形式的目标函数
确定性优化:目标函数或者约束函数中不涉及随机变量而是确定的问题
(4)线性规划和非线性规划
线性规划:当目标函数和约束函数均为线性函数时,问题称为线性规划。目前来说线性规划可以比较容易的可以被求解的。其主要的求解方法分别为单纯形法和内点法
非线性规划:当目标函数和约束函数中至少有一个为非线性函数时,相应的问题称为非线性规划
(5)凸优化和非凸优化
凸优化:目标函数和约束函数都是凸函数的极小化问题。凸优化问题的任何局部最优解都是全局最优解,其相应的算法设计以及理论分析相对非凸优化问题简单很多
非凸优化:如果其中有一个或者两者都不是凸的,那么相应的最小化问题是非凸优化问题
(6)其他
- 如果目标函数是二次函数而约束函数是线性函数则称为二次规划
- 包含非光滑函数的问题称为非光滑优化
- 不能直接求导数的问题称为无导数优化
- 变量只能取整数的问题称为整数规划
- 在线性约束下极小化关于半正定矩阵的线性函数的问题称为半定规划,其广义形式为锥规划
- 最优解只有少量非零元素的问题称为稀疏优化
- 最优解是低秩矩阵的问题称为低秩矩阵优化
- 此外还有几何优化、二次锥规划、张量优化、鲁棒优化、全局优化、组合优化、网络规划、随机优化、动态规划、带微分方程约束优化、微分流形约束优化、分布式优化等