数学扫盲----拉格朗日乘子法

最新推荐文章于 2024-06-11 02:53:31 发布

只布布倩

最新推荐文章于 2024-06-11 02:53:31 发布

阅读量9.2k

点赞数 10

分类专栏：数学机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangyingjie09/article/details/80368494

版权

机器学习同时被 2 个专栏收录

19 篇文章 1 订阅

订阅专栏

17 篇文章 1 订阅

订阅专栏

基本的拉格朗日乘子法就是求函数f(x1,x2,...)在约束条件g(x1,x2,...)=0下的极值的方法。其主要思想是将约束条件函数与原函数联立，从而求出使原函数取得极值的各个变量的解。拉格朗日乘子法是在支持向量机为了更好的求解间距的方法。

在求解最优化问题中，拉格朗日乘子法（Lagrange Multiplier）和KKT（Karush Kuhn Tucker）条件是两种最常用的方法。在有等式约束时使用拉格朗日乘子法，在有不等约束时使用KKT条件。

我们这里提到的最优化问题通常是指对于给定的某一函数，求其在指定作用域上的全局最小值(因为最小值与最大值可以很容易转化，即最大值问题可以转化成最小值问题)。二者均是求解最优化问题的方法，不同之处在于应用的情形不同。

一般情况下，最优化问题会碰到一下三种情况：

（1）无约束条件 （2）等式约束条件（3）不等式约束条件

（1）无约束条件

　　这是最简单的情况，解决方法是函数对变量求导，令求导函数等于0的点可能是极值点。将结果带回原函数进行验证。

（2）等式约束条件

设目标函数为f(x)，约束条件为hk(x)，形如:s.t. 表示subject to ，“受限于”的意思，l表示有l个约束条件。

　　　　　　　　

则解决方法是消元法或者拉格朗日法。这里主要讲拉格朗日法，后面提到的KKT条件是对拉格朗日乘子法的一种泛化。

　例如给定椭球:

　　　　　　　　　　

　　求这个椭球的内接长方体的最大体积。这个问题实际上就是条件极值问题，即在条件下，求的最大值。

　　当然这个问题实际可以先根据条件消去 z (消元法)，然后带入转化为无条件极值问题来处理。但是有时候这样做很困难，甚至是做不到的，这时候就需要用拉格朗日乘数法了。首先定义拉格朗日函数F(x)：

　　　　　　　　（其中λk是各个约束条件的待定系数。）

然后解变量的偏导方程：

　　　　......,

　　　如果有l个约束条件，就应该有l+1个方程。求出的方程组的解就可能是最优化值（高等数学中提到的极值），将结果带回原方程验证就可得到解。

　　　回到上面的题目，通过拉格朗日乘数法将问题转化为

　　　　

　　　对求偏导得到

　　　

　　　联立前面三个方程得到和，带入第四个方程解之

　　　　

　　　带入解得最大体积为：

　　　　

（3）不等式约束条件

设目标函数f(x)，不等式约束为g(x)，有的教程还会添加上等式约束条件h(x)。此时的约束优化问题描述如下：

　　　　　　　　

则我们定义不等式约束下的拉格朗日函数L，则L表达式为：

　　　　　　　　

其中f(x)是原目标函数，hj(x)是第j个等式约束条件，λj是对应的约束系数，gk是不等式约束，uk是对应的约束系数。

　　常用的方法是KKT条件，同样地，把所有的不等式约束、等式约束和目标函数全部写为一个式子L(a, b, x)= f(x) + a*g(x)+b*h(x)，

　　KKT条件是说最优值必须满足以下条件：

　　　　1）L(a, b, x)对x求导为零；

　　　　2）h(x) =0;

　　　　3）a*g(x) = 0;

求取这些等式之后就能得到候选最优值

该方法适用于约束条件下求极值的问题。对于没有约束的极值问题，显然，如果某一点是极值的必要条件是该点的各方向的偏导数皆为零，也就是说，如果偏导数不全为零，那么就不可能是极值。

总结：拉格朗日乘子法其实是借助了假设的思想。假设存在这样一个极值，定义一个公式，然后借助偏导数来就解。

借鉴文章：深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件

关注

10
点赞
踩
39

收藏

觉得还不错? 一键收藏
2
评论
数学扫盲----拉格朗日乘子法

基本的拉格朗日乘子法就是求函数f(x1,x2,...)在约束条件g(x1,x2,...)=0下的极值的方法。其主要思想是将约束条件函数与原函数联立，从而求出使原函数取得极值的各个变量的解。拉格朗日乘子法是在支持向量机为了更好的求解间距的方法。先占个位。...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。