机器学习中的数学——拉格朗日乘子法（二）：不等式约束与KKT条件

最新推荐文章于 2024-04-02 09:27:53 发布

von Neumann

最新推荐文章于 2024-04-02 09:27:53 发布

阅读量1.5w

点赞数 15

分类专栏：机器学习中的数学文章标签：机器学习深度学习支持向量机 kkt条件拉格朗日乘子法

本文链接：https://blog.csdn.net/hy592070616/article/details/119839152

版权

机器学习中的数学专栏收录该内容

112 篇文章 810 订阅

订阅专栏

现在接着《拉格朗日乘子法（一）：等式约束的拉格朗日乘子法》的思路考虑不等式约束 $g(x)\leq0$ 的情景。如下图所示，此时最优点 $x^*$ 或在 $g (x) < 0$ 的区域中，或在边界 $g (x) = 0$ 上。

$g (x) < 0$ 的情况：约束 $g(x)\leq0$ 不起作用，可直接通过条件 $\nabla f(x)=0$ 来获得最优点。这等价于将 $\lambda$ 置零然后对 $\nabla_xL(x,\lambda)$ 置零得到最优点。
$g (x) = 0$ 的情况：类似于《拉格朗日乘子法（一）：等式约束的拉格朗日乘子法》中等式约束的分析，但需注意的是，此时梯度 $\nabla g(x^*)$ 的方向和梯度 $\nabla f(x^*)$ 的方向必须相反，即存在常数 $\lambda>0$ 使得 $\nabla f(x^*)+\lambda\nabla g(x^*)=0$ 。

整合这两种情形，必满足入 $\lambda g(x)=0$ 。因此在约束 $g(x)\leq0$ 下最小化 $f (x)$ ，可转化为在如下约束下最小化式的拉格朗日函数：
$\left\{ \begin{aligned} g(x)&\leq 0\\ \lambda&>0\\ \mu_jg_j(x)&=0 \end{aligned} \right.$
上式称为Karush-Kuhn-Tucker(KKT)条件。上述做法可推广到多个约束。考虑具有 $m$ 个等式约束和 $n$ 个不等式约束：
$\begin{aligned} \min_x&\quad f(x)\\ \text{s.t.}&\quad h_i(x)=0\qquad ,i=1,2,\cdots,m\\ &\quad g_j(x)\leq0\qquad ,j=1,2,\cdots,n\\ \end{aligned}$

引入拉格朗日乘子 $\lambda=(\lambda_1, \lambda_2, \cdots, \lambda_m)^T$ 和 $\mu=(\mu_1, \mu_2, \cdots,\mu_n)^T$ ，相应的拉格朗日函数为：
$\lambda, \mu)=f(x)+\sum_{i=1}^m\lambda_ih_i(x)+\sum_{j=1}^n\mu_jg_j(x)$ 由不等式约束引入的KKT条件：
$\left\{ \begin{aligned} \nabla_X L(x,\lambda, \mu)&=\nabla f+\lambda_i\nabla h_i+\mu_j\nabla g_j=0\\ h_i(x)&=0\\ g_j(x)&\leq 0\\ \mu_j&\geq0\\ \mu_jg_j(x)&=0 \end{aligned} \right.$

即可求解。

von Neumann

关注

15
点赞
踩
60

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习中的数学——拉格朗日乘子法（二）：不等式约束与KKT条件

现在接着《拉格朗日乘子法（一）：等式约束的拉格朗日乘子法》的思路考虑不等式约束g(x)≤0g(x)\leq0g(x)≤0，如下图所示，此时最优点x∗x^*x∗或在g(x)<0g(x)<0g(x)<0的区域中，或在边界g(x)=0g(x)=0g(x)=0上。对于g(x)<0g(x)<0g(x)<0的情形，约束g(x)≤0g(x)\leq0g(x)≤0不起作用，可直接通过条件∇f(x)=0\nabla f(x)=0∇f(x)=0来获得最优点。这等价于将λ\lambdaλ置零然
复制链接

扫一扫