【最优化方法】约束最优化问题

撕得失败的标签

已于 2024-01-04 11:29:49 修改

阅读量1.4k

点赞数 24

分类专栏：最优化方法文章标签：约束最优化 KKT定理二次罚函数方法

于 2024-01-02 00:02:17 首次发布

本文链接：https://blog.csdn.net/qq_61828116/article/details/135330731

版权

最优化方法专栏收录该内容

8 篇文章 4 订阅

订阅专栏

文章目录

不等式约束问题
等式约束问题
- 二次罚函数方法
- 示例

不等式约束问题

考虑约束最优化问题
$\begin{aligned}\min&\quad f(x)\\\mathrm{s.t.}&\quad c_i(x)=0,\quad i=1,2,\cdots,m^{\prime},\\&\quad c_i(x)\geqslant0,\quad i=m^{\prime}+1,m^{\prime}+2,\cdots,m,\end{aligned}$

其中 $x\in\mathbf{R}^n,m^{\prime}\leqslant m$ ，记可行域 $X$ 为
$X=\{x\mid c_i(x)=0,\:i=1,\cdots,m^{\prime};\:c_i(x)\geqslant0,\:i=m^{\prime}+1,\cdots,m\}.$

可行方向

设 $x^*\in X,0\neq d\in\mathbf{R}^n$ ，如果存在 $\delta>0$ 使得
$x^{*}+td\in X,\quad\forall t\in[0,\delta],$

则称 $d$ 是 $X$ 在 $x^{*}$ 处的可行方向， $X$ 在 $x^{*}$ 处的所有可行方向组成的集合记为 $\mathcal{FD}(x^*,X).$

线性化可行方向

设 $x^*\in X,\:0\neq d\in\mathbf{R}^n$ ,如果
$\begin{array}{ll}{d^{\mathrm{T}}\nabla c_{\mathrm{i}}(x^{*})=0,\quad i\in\mathcal{E};}\\{d^{\mathrm{T}}\nabla c_{\mathrm{i}}(x^{*})\geqslant0,\quad i\in\mathcal{I}(x^{*});}\\\end{array}$

则称 $d$ 是 $X$ 在 $x^*$ 处的线性化可行方向， $X$ 在 $x^*$ 处的所有线性化可行方向的集合记为 $\mathcal{LFD}(x^*,X).$

序列可行方向

设 $x^*\in X,\quad0\neq d\in\mathbf{R}^n$ ，如果存在序列 $\{d_k\}(k=1,2,\cdots)$ 和 $\{\delta_k\}(k=1,2,\cdots)$ 使得
$x^{*}+\delta_{k}d_{k}\in X,$

具有 $d_k\to d,\delta_k>0$ 和 $\delta_k\to0$ , 则称 $d$ 是 $X$ 在 $x^*$ 处的序列可行方向。 $X$ 在 $x^*$ 处的所有序列可行方向的集合记为 $S\mathcal{FD}(x^*,X).$

KKT 定理

设 $x^*$ 是问题的局部极小点，设 $f(x),c_i(x)(i=1,\cdots,m)$ 在 $x^*$ 的邻城内一阶连续可微，如果约束规范条件 (CQ)
$\mathcal{SFD}(x^{*},X)=\mathcal{LFD}(x^{*},X)$

成立，则存在 $\lambda_i^*(i=1,2,\cdots,m)$ 使得
$\begin{aligned} &\nabla f(x^{*})=\sum_{i=1}^{m}\lambda_{i}^{*}\nabla c_{i}(x^{*}), \\ &c_{i}(x^{*})=0,\:i\in\mathcal{E}, \\ &c_{i}(x^{*})\geqslant0,\:i\in\mathcal{I}, \\ &\lambda_{i}^{*}\geqslant0,\quad i\in\mathcal{I}, \\ &\lambda_{i}^{*}c_{i}(x^{*})=0,\:i\in\mathcal{I}. \end{aligned}$

示例

$\begin{aligned} \min&\quad (x_1-6)^2+(x_2-6)^2\\ \mathrm{s.t.}&\quad x_1+x_2=1\\ &\quad 2x_1+3x_2 \leqslant 6 \end{aligned}$

解：我们可以使用拉格朗日乘数法（KKT条件是其在非线性优化中的推广）来求解。首先构建拉格朗日函数
$L(x_1, x_2, \lambda_1, \lambda_2) = (x_1 - 6)^2 + (x_2 - 6)^2 + \lambda_1(x_1 + x_2 - 1) + \lambda_2(2x_1 + 3x_2 - 6)$

接下来，我们需要满足KKT条件：

原始问题的梯度等于拉格朗日函数的梯度：
$\nabla_x L = \begin{bmatrix} 2(x_1 - 6) + \lambda_1 + 2\lambda_2 \\ 2(x_2 - 6) + \lambda_1 + 3\lambda_2 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}$
约束条件必须得到满足：
$x_1 + x_2 = 1 \\ 2x_1 + 3x_2 \leqslant 6$
拉格朗日乘子对应的互补松弛条件：
$\lambda_1(x_1 + x_2 - 1) = 0 \\ \lambda_2(2x_1 + 3x_2 - 6) = 0$

并且要求 $λ_1 ≥ 0$ ，当 $x_1 + x_2 ≠ 1$ 时取等号； $λ_2 ≥ 0$ ，当 $2x_1 + 3x_2 < 6$ 时取等号。

联立以上方程可得方程组：
$\begin{aligned} 2(x_1-6) + \lambda_1 + 2\lambda_2 &= 0 \\ 2(x_2-6) + \lambda_1 + 3\lambda_2 &= 0 \\ x_1 + x_2 &= 1 \\ -2x_1 - 3x_2 &\geq -6 \\ \lambda_1 &\geq 0 \\ \lambda_2 &\geq 0 \\ \lambda_1 (x_1 + x_2 - 1) &= 0 \\ \lambda_2 (2x_1 + 3x_2 - 6) &= 0 \end{aligned}$

等式约束问题

二次罚函数方法

对于等式约束问题
$\begin{aligned} \min_x & \quad f(x)\\\mathrm{s.t.}&\quad c_i(x)=0,\quad i\in\varepsilon, \end{aligned}$

二次罚函数 $Q(x;\mu)$ 定义
$Q(x;\mu)\triangleq f(x)+\frac{1}{2\mu}\sum_{i\in{\mathcal E}}c_{i}^{2}(x),$

这里 $\mu>0$ 是罚参数，当 $\mu$ 趋于零时，如果约束不可行，即 $c_i(x)\neq0,i\in\mathcal{E}$ ，则违反约束的惩罚项剧烈地增大。可以证明：当 $\mu_k\downarrow0$ 时罚函数 $Q(x;\mu_k)$ 的极小点 $x_k$ 就是原问题的极小点。因为惩罚项是二次的，所以光滑可微，这样可以使用无约束优化技术来求解得罚函数 $Q(x;\mu_k)$ 的近似极小点 $x_k.$

二次罚函数方法是一种用于处理约束最优化问题的优化算法，它通过在目标函数中引入二次罚项，将约束问题转化为无约束问题。以下是二次罚函数方法的一般步骤：

给定 $\mu_0>0$ , 允许参数值 $\varepsilon>0$ ，初始点 $x_0^s$ ； $k = 0.$
从 $x_k^s$ 开始，极小化 $Q(x;\mu_k)$ 得近似极小点 $x_k$ ；
当 $\|\nabla Q(x;\mu_k)\|\leqslant\varepsilon$ 时，终止，得近似解 $x_k$ ；否则，选择新的罚参数 $\mu_{k+ 1}\in ( 0, \mu_k)$ ，令 $x_{k+ 1}^s: = x_k, k: = k+ 1$ ，转步 2.

注意，罚参数序列 $\{\mu_k\}$ 要合适地选择. 当极小化 $Q(x;\mu_k)$ 的计算量很大时，可以选择适当缩小 $\mu_k$ ，例如 $\mu_{k+1}=0.7\mu_k$ . 如果极小化 $Q(x;\mu_k)$ 计算量不大，可大大地缩小 $\mu_k$ ，例如 $\mu_{k+1}=0.1\mu_k$ . 另外，终止条件 $\|\nabla Q(x;\mu_k)\|\leqslant\varepsilon$ 也可采用 $\|c(x_k)\|\leqslant\varepsilon.$

示例

考虑问题
$\begin{aligned} \min & ~~~~\frac{1}{2}(x_1-3)^2+(x_2-3)^2 \\ \mathrm{s.t.} & ~~~~ x_1+x_2=1 \end{aligned}$

不同因子 $\mu$ ，求极小值点 $Q(x,\mu)$
$Q(x,\mu)=\frac{1}{2}(x_1-3)^2+(x_2-3)^2+\frac{1}{2\mu}(x_1+x_2-1)^2$ $\begin{aligned} c_1 & = x_1-3 + \frac{1}{\mu}(x_1+x_2-1) = 0 \\ c_2 & = 2x_2-6 + \frac{1}{\mu}(x_1+x_2-1) = 0 \\ \end{aligned}$

我们可以先给罚参数 $\mu$ 一个初始值 $1$ ，然后逐步减小罚参数

当 $\mu = 1$ 时
$\begin{cases} 2x_1+x_2-4=0\\ x_1+3x_2-7=0 \end{cases} \Rightarrow \begin{cases} x_1=1\\ x_2=2\\ \end{cases}$

当 $\mu = 0.1$ 时 $x_1 = -0.21875 ~~ x_2 = 1.4375$

当 $\mu = 0.01$ 时 $x_1 = -0.3211920529801325 ~~ x_2 = 1.344370860927152$

当 $\mu = 0.001$ 时 $x_1 = -0.3321119253830779 ~~ x_2 = 1.334443704197202$

可见 $Q(x;\mu)$ 非常接近极小点 $\begin{aligned}(-\frac{1}{3},\frac{4}{3})^T\end{aligned}$

其实这题可以直接通过化简得到
$\begin{aligned} x_1 & = \frac{3\mu-1}{2\mu+3} = \frac{3}{2} - \frac{11}{4\mu+6} \\ x_2 & = \frac{6\mu+4}{2\mu+3} = 3 - \frac{5}{2\mu+3} \\ \end{aligned}$

显然当 $\mu \to 0$ 函数收敛至 $\begin{aligned}(-\frac{1}{3},\frac{4}{3})^T\end{aligned}$

撕得失败的标签

关注

24
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
【最优化方法】约束最优化问题

二次罚函数方法是一种用于处理约束最优化问题的优化算法，它通过在目标函数中引入二次罚项，将约束问题转化为无约束问题。因为惩罚项是二次的，所以光滑可微，这样可以使用无约束优化技术来求解得罚函数。的邻城内一阶连续可微，如果约束规范条件 (CQ)，则违反约束的惩罚项剧烈地增大。处的所有线性化可行方向的集合记为。的计算量很大时，可以选择适当缩小。处的所有可行方向组成的集合记为。处的所有序列可行方向的集合记为。趋于零时，如果约束不可行，即。是问题的局部极小点，设。否则，选择新的罚参数。处的线性化可行方向，
复制链接

扫一扫