【最优化基础】惩罚和障碍函数

最新推荐文章于 2024-05-31 15:25:33 发布

稷殿下

最新推荐文章于 2024-05-31 15:25:33 发布

阅读量2.7k

点赞数

分类专栏：最优化文章标签：最优化序列最小化优化算法线性规划机器学习

本文链接：https://blog.csdn.net/qq_38904659/article/details/111599907

版权

最优化专栏收录该内容

10 篇文章 3 订阅

订阅专栏

点击【原文】阅读原文，效果更佳！

惩罚和障碍函数

为了简化表示，讨论如下等式约束问题：
$\begin{aligned} \min_{{\pmb x} \in \mathbb{R}^n} ~~& f({\pmb x})\\ \text{s.t.} ~~& c({\pmb x}) = \pmb{0} \end{aligned}$
其中， $c({\pmb x}): ~ \mathbb{R}^n \to \mathbb{R}^m$ ，或不等式约束问题
$\begin{aligned} \min_{{\pmb x} \in \mathbb{R}^n} ~~& f({\pmb x})\\ \text{s.t.} ~~& c({\pmb x}) \leq \pmb{0} \end{aligned}$

罚函数法

动机

在求解约束不容易消去的非线性规划问题时，为了保证大范围收敛（即从任意的初始近似解都能收敛于一个局部解），必须在"减小目标值"和"保留在可行域内或临近可行域"这两个目标之间进行折衷，这就不可避免地引入了罚函数的思想。

定义

罚函数是目标 $f$ 和约束 $c$ 之间的某种组合，它通过惩罚控项制违反约束来极小化 $f$ 。

Courant 罚函数

最早的罚函数由 Courant 于 1943 年提出，其采用约束违反量的平方作为惩罚项，因此也称为 Courant 二次罚函数。

例考虑问题
$\begin{aligned} \min ~~& x\\ \text{s.t.} ~~& 1 - x = 0 \end{aligned}$
的罚函数
$\phi(x,\sigma) = x + \frac{1}{2}\sigma(1 - x)^2$
如下图所示：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hGdMDbrB-1608730947586)

易得当 $\sigma \to \infty$ 时， $\phi(x,\sigma)$ 的极小点趋近于原问题的最优解 $x^* = 1$ 。

由此，人们提出了求解一系列极小化问题的技术，成为序列最小化技术。

算法 1 序列极小化技术算法

选择一个固定的序列 $\{\sigma_i : i = 1, 2, 3, \dots\} = \{10,10^2,10^3,10^4,\dots\}$ ，使得 $\sigma_k \to \infty$ ；
do 对于 $\forall \sigma_i$ ，求解
$\min_{\pmb x} ~~ \phi({\pmb x}, \sigma_i)$
的一个局部最优解 ${\pmb x}(\sigma_i)$

while $c({\pmb x}(\sigma_i))$ 充分小。

事实上，算法 1 不能在有限步内求得全局解，仅是一个理想化的算法。尽管适当放松精度可以保证收敛，但还需假设

局部极小点 ${\pmb x}(\sigma_i)$ 存在；
得到的 ${\pmb x}(\sigma_i)$ 尽可能精确。

在实际应用中，无论是非线性问题无界还是存在局部解，该假设都是不成立的。

定理 1 假设每次得到无约束极小化问题地全局极小点，若 $\sigma_k \upharpoonleft \infty$ ，则

$\{\phi({\pmb x}, \sigma_k)\}$ 单调递增；
${{c^{(k)}}^Tc^{(k)}\}$ 单调递减；
${f^{(k)}\}$ 单调递增，

同时 $c^{(k)} \to 0$ ，且 $\{{\pmb x}^{(k)}\}$ 的任何据点是原始问题的解。

证明略。

注意结论 2 表明 $\{{\pmb x}^{(k)}\}$ 是从可行域外接近原问题的解，因此也是外部罚函数。

Lagrange 乘子估计

定义向量 $\lambda_i^{(k)} = \sigma_k c_i^{(k)}, i = 1,2,\dots, m$ 为 Language 乘子的估计，有如下收敛性性质。

定理 2 假设每次得到无约束问题的局部解，若 $\sigma_k \upharpoonleft \infty$ ， ${\pmb x}^*$ 是序列的一个聚点，且 $\mathrm{rank}({\pmb A}^*) = m$ ，则 ${\pmb x}^*$ 是原问题的KKT点，有
$\begin{aligned} \lambda^{(k)} & = & \lambda^* + o(1)\\ c^{(k)} & = & \frac{\lambda^*}{\sigma_k} + o(\frac{1}{\sigma}) \\ \sigma_k {c^{(k)}}^Tc^{(k)} & = & \frac{{\lambda^*}^T \lambda^*}{\sigma_k} + o(\frac{1}{\sigma}) \end{aligned}$
若在 ${\pmb x}^*, \lambda^*$ 处二阶充分条件成立，则
$\begin{aligned} f^* & = & \phi^* = \phi^{(k)} + \frac{1}{2}\sigma_k {c^{(k)}}^Tc^{(k)} + o(\frac{1}{\sigma})\\ h^{(k)} & = & \frac{T^* \lambda^*}{\sigma_k} + o(\frac{1}{\sigma}) \end{aligned}$
其中， $h^{(k)} = {\pmb x}^{( k)} - {\pmb x}^*$ ， $T^*$ 定义为

$\begin{bmatrix} W^* & A^*\\ {A^*}^T & 0 \end{bmatrix} = \begin{bmatrix} H^* & T^*\\ {T^*}^T & U^* \end{bmatrix}$

事实上，对于二次罚函数，有
$\nabla^2 \phi({\pmb x}^{(k)},\sigma_k) = W^{(k)} + \sigma_k A^{(k)} {A^{(k)}}^T$
其中， $W^{(k)} = \nabla^2_{\pmb x} \mathcal{L}({\pmb x}^{(k)},\lambda^{(k)})$ ， $\lambda_i^{(k)} = \sigma_k c_i^{(k)}, i = 1,2,\dots,m$ 。其特点是一阶可微，但需要满足 $\sigma_k \to \infty$ 。

不等式约束罚函数

不等式约束问题，可以等价地转化为等式约束
$c({\pmb x}) \leq 0 \iff \max\{c({\pmb x}),0\} = 0$
从而，不等式约束问题地罚函数为
$\phi({\pmb x}, \sigma) = f({\pmb x}) + \frac{1}{2}\sigma\sum_{i \in \mathcal{I}} \max\{c_i({\pmb x}),0\}$

障碍函数

由于该方法适合可行域外无定义的约束问题，因为得到的序列极小化问题也是可行的，因此该方法也被成为内点法。

定义

障碍函数法是一种求解不等式约束问题的序列极小化方法，其旨在障碍项在边界上取值为无穷大，从而在任何时候都能满足约束。

对数障碍函数

1955 年，Frisch 提出对数障碍函数
$\phi({\pmb x}, \mu) = f({\pmb x}) - \mu \sum_i \log(-c_i({\pmb x}))$
例对于不等式约束问题
$\begin{aligned} \min ~~& x\\ \text{s.t.} ~~& 1 - x \leq 0 \end{aligned}$
其对数障碍函数 $\phi({ x},\mu) = { x} - \mu \log ({ x - 1})$ 图像如下，可以看出当 $\mu_k \to 0$ 时， $x(\mu_k) \to x^*$ 。

障碍函数中递增的病态性

特点：原问题是凸规划时，障碍函数时凸函数。一阶可微，需要满足 $\mu \to 0$ 。

倒数障碍函数

1961 年，Carroll 提出倒数障碍函数
$\phi({\pmb x}, \mu) = f({\pmb x}) - \mu \sum_{i = 1}^m [c_i({\pmb x})]^{-1}$
一般来说，倒数障碍函数比二次罚函数和对数障碍函数要差。

内点法（路径跟踪法）

对数障碍函数法也称为原始内点法，其中乘子由原始变量确定。

令 $\mathrm{diag} (c_1(x), c_2(x),\cdots,c_m(x))$ ， $[a_1(x), a_2(x),\dots,a_m(x)]$ ，则

KKT 条件

$\begin{aligned} g(x) + A(x) \lambda &=& 0 \\ C(x) \lambda & = & 0\\ c(x) & \leq & 0 \\ \lambda & \geq & 0 \end{aligned}$

扰动的 KKT 条件

$\begin{aligned} g(x) + A(x) \lambda &=& 0 \\ C(x) \lambda & = & \color{blue}{- \mu}\\ c(x) & \color{blue}{<} & 0 \\ \lambda & \color{blue}{>} & 0 \end{aligned}$

动机

令 $\mu \to 0$ ，跟踪方程组
$\begin{aligned} g(x) + A(x) \lambda & = & 0 \\ C(x) + \mu & = & 0 \end{aligned}$
保存 $0,\lambda>0$ 的解，直至 $\mu$ 逐渐递减至零。

参考资料

[1] 刘红英，夏勇，周永生. 数学规划基础，北京，北京航空航天大学出版社，2012.

稷殿下

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【最优化基础】惩罚和障碍函数

点击【原文】阅读原文，效果更佳！惩罚和障碍函数为了简化表示，讨论如下等式约束问题：KaTeX parse error: No such environment: equation* at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲*̲}̲\begin{aligned}…其中，c(x): Rn→Rmc({\pmb x}): ~ \mathbb{R}^n \to \mathbb{R}^mc(xxx): Rn→Rm，或不等式约束问题KaTeX pars
复制链接

扫一扫