拉格朗日乘子法原理：等式约束和不等式约束KKT条件

supercolar

已于 2024-07-08 08:30:22 修改

阅读量1.2w

点赞数 10

分类专栏：机器学习文章标签：拉格朗日乘子法不等式约束 KKT条件等式约束

于 2019-10-14 10:36:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35732969/article/details/80816249

版权

机器学习专栏收录该内容

28 篇文章 4 订阅

订阅专栏

我的小程序：

待办计划：在不确定中前行

随笔日记：祭那些逝去的时光

拉格朗日乘子法是寻找函数在一组约束下的极值方法。

1、等式约束

形式：(x是d维向量)

min f(x)

s.t. h(x) = 0.

写成如下形式：

min f(x)+lambda*h(x)(lambda为参数)

s.t. h(x) = 0.

发现两者是等价的。

记：拉格朗日函数L(x,lambda) = f(x)+lambda*h(x).

发现约束条件h(x)=0,其实就是对拉格朗日函数L(x,lambda)关于lambda求偏导等于0得到，略去该约束，继而原约束优化问题就转化成了对拉格朗日函数L(x,lambda)的无约束优化问题（即令L关于x和lambda的偏导等于0求解）。

几何解释：

原目标函数f(x)取得最小化点x*时，可以得到如下结论：

a.约束曲面上的任意点x,该点的梯度正交于约束曲面；

b.在最优点x*，目标函数在该点的梯度正交于约束曲面（可以反正：若目标函数梯度与约束曲面不正交，则总可以在约束曲面上移动该点使目标函数进一步减小）。

所以，在最优点x*，梯度▽f(x*)和▽h(x*)的方向相同或相反，即存在lambda!=0,使：

▽f(x*)+lambda*▽h(x*)=0. （1式）

定义拉格朗日函数：L(x,lambda) = f(x)+lambda*h(x).

令L(x,lambda)对x的偏导数等于0，得到1式；令L(x,lambda)对lambda的偏导数等于0，得到约束条件h(x)=0。于是，原约束优化问题转化为无约束优化问题。

2、不等式约束

形式：

min f(x)

s.t. g(x) <= 0.

同样定义拉格朗日函数L(x,lambda) = f(x)+lambda*g(x).

此时，首先看目标函数f(x)在无约束条件下的最优点，显然要么在g(x)<=0的区域内，要么在g(x)>0的区域内。

若f(x)在无约束条件下的最优点在g(x)<=0区域内，则约束条件g(x)<=0不起作用（即可直接求min f(x)，得到的结果必然满足g(x)<=0），相当于lambda=0；

若f(x)在无约束条件下的最优点不在g(x)<=0区域内，则f(x)在约束条件下的最优点必然在g(x)<=0区域边界，即在边界g(x)=0上。此类情形类似于等式约束，但此时梯度▽f(x*)和▽g(x*)的方向相反（梯度方向是函数值增大最快的方向），即存在lambda>0，使▽f(x*)+lambda*▽g(x*)=0。

整合上述两种情形，必有lambda*g(x) = 0。所以原不等式约束问题就转化为：

min L(x,lambda)

s.t. g(x)<=0,

lambda>=0,

lambda*g(x)=0.

上面的约束条件即为KKT条件。

待办计划：在不确定中前行

随笔日记：祭那些逝去的时光

参考资料：周志华《机器学习》

参考博文：拉格朗日乘子法及KKT条件证明

关注

10
点赞
踩
30

收藏

觉得还不错? 一键收藏
1
评论
拉格朗日乘子法原理：等式约束和不等式约束KKT条件

拉格朗日乘子法是寻找函数在一组约束下的极值方法。1、等式约束形式：(x是d维向量)min f(x)s.t. h(x) = 0.写成如下形式：min f(x)+lambda*h(x)(lambda为参数)s.t. h(x) = 0.发现两者是等价的。记：拉格朗日函数L(x,lambda) =f(x)+lambda*h(x).发现约束条件h(x)=0,其实就是...
复制链接

扫一扫

专栏目录

supercolar CSDN认证博客专家 CSDN认证企业博客

码龄8年

73: 原创

5万+: 周排名

42万+: 总排名

34万+: 访问

: 等级

3802: 积分

95: 粉丝

277: 获赞

128: 评论

941: 收藏

私信

关注

热门文章

分类专栏

多任务学习 1篇
C++ 2篇
paddlepaddle 1篇
ceres
vs2022
机器学习 28篇
数字图像处理 11篇
python 11篇
凸优化 2篇
其他 18篇
TensorFlow 6篇
计算机视觉 9篇
caffe 2篇
pytorch 4篇

最新评论

图像处理之频率域滤波
CSDN-Ada助手: 人工智能在图像搜索和定位方面的应用有哪些？
抓取了北上广深人工智能行业的招聘信息，才发现工资60K是怎样的存在
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)增加条理清晰的目录。
机器学习：密度聚类-DBSCAN算法简介（附代码实现）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)增加条理清晰的目录。
机器学习：原型聚类-k均值算法k-means(附代码实现)
CSDN-Ada助手: 如何度量变量之间的相关性？
机器学习：贝叶斯网浅析（附代码实现）
CSDN-Ada助手: 为什么要使用机器学习？比较传统编程又有什么优势？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。