【机器学习之---数学】拉格朗日乘子法

最新推荐文章于 2024-06-28 15:37:39 发布

胡侃有料

最新推荐文章于 2024-06-28 15:37:39 发布

阅读量959

点赞数 7

分类专栏： # ML中的数学文章标签：机器学习人工智能

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/weixin_39190382/article/details/137038457

版权

ML中的数学专栏收录该内容

5 篇文章 0 订阅

订阅专栏

every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

优化之
拉格朗日乘子法

1. 概念

拉格朗日乘子法是一种将约束优化问题转化为无约束优化问题的方法，如下面的优化问题：

$minf(\pmb{x}) \quad s.t. g(\pmb{x}) = 0$

s.t. 是subject to 的缩写，意思是，受限于，即，约束条件

因为有约束存在，无法方便求解，但是如果通过引入拉格朗日函数，

$L(\pmb{x},\lambda) = f(\pmb{x}) + \lambda g(\pmb{x})$

这样函数L就没有约束了，其中， $\lambda$ 称为拉格朗日乘子。原问题可以转化为无约束优化问题：

$\left\{ \begin{matrix} \nabla_xL(\pmb{x},\lambda) = 0 \\ g(\pmb{x}) = 0 \end{matrix} \right.$

第一行是 $\nabla_xL$ 即L对 $\pmb{x}$ 的各个分量偏导都等于0，
第二行是 $L$ 对 $\lambda$ 的偏导等于0，这样我们就将原问题转化为无约束优化问题。

但注意此方程组只是必要条件，即这个方程组求出来的解不一定都是最优解（例如存在鞍点），但是最优解一定在里面。在一些特殊情况下，如f是凸函数，这个方程组的解就才一定是最优解。

2. 理解

为什么最优解在 $\nabla_xL(\pmb{x},\lambda) = 0 ,\quad g(\pmb{x}) = 0$ 解集中呢？，不妨考虑如下问题：

$minf(x_1,x_2) \quad s.t. g(x_1,x_2)=0$

目标函数 $f(x_1,x_2)$ 是曲面，在xy中用等高线表示，g(x_1,x_2)是曲线，在xy中用黄线表示，

1710751409411

仔细想想可以发现：我们所求的在黄线约束 $g(x_1,x_2) = 0$
下的最优点P一定是约束曲线g=0与目标函数f的某一条等值线的切点，也就是最优点P处约束曲线的法向量 $\nabla g$
一定与该处的目标函数的梯度
共线（同向或反向，因为
的方向可正可负）。如下图所示：

v2-d5794fa1585a32f1ccc3add04d19b7dc_720w

如果不共线？

如下图所示，假设最优点P处，目标函数梯度 $\nabla f$
与约束的法向量 $\nabla g$ 不共线，因此负梯度 $-\nabla f$
（表示f下降最快的方向）与 $\nabla g$ 也不会共线，这样一来负梯度 $-\nabla f$ 在约束曲线g 上的切向上就存在紫色的分量
，这就表明黄线上的P点沿此方向再挪一点，目标函数值还能进一步下降，所以当前的P点并不是最优点，与假设矛盾。

v2-2f787863ae79d810256e6c3e46efa402_720w

故，可用如下数学表达式：

$\exists \lambda \in R,使得，\nabla f+ \lambda \nabla g = 0$

所以拉格朗日乘子 $\lambda$ 就是待求的一个伸缩系数，令 $L(x,\lambda) = f(x) +\lambda g(x)$ 后，
$\nabla_xL(x,\lambda) = \nabla_xf(x) + \lambda \nabla_xg(x) = 0$

同时， $g (x) = 0$

参考

https://zhuanlan.zhihu.com/p/440297403
https://zhuanlan.zhihu.com/p/154517678

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
【机器学习之---数学】拉格朗日乘子法

优化之拉格朗日乘子法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

胡侃有料 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。