机器学习(四)监督学习---拉格朗日乘子法

 
 

        Q1: 对于一个有 n 个变量与 k 个约束条件的最优化问题转换为一个有 n + k 个变量的方程组的极值问题,其变量不受任何约束,这样如何解决?
 

        拉格朗日乘子法 (Lagrange Multiplier Method): 用于解决约束优化问题,是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。

                在这里插入图片描述


                                在这里插入图片描述
解析上式:

  • gi(x)>0,即不满足约束条件时,由于内层取max,因此 α i = ∞   ⇒   α i g i ( x ) = ∞ \alpha _{i}=\infty \ \Rightarrow \ \alpha _{i}g_{i}(x)=\infty αi=  αigi(x)=
  • gi(x) ≤ 0,即满足约束条件时,由于内层取max,因此 α i = 0   ⇒   α i g i ( x ) = 0 \alpha _{i}=0\ \Rightarrow \ \alpha _{i}g_{i}(x)=0 αi=0  αigi(x)=0
  • hj(x) ≠ 0,即不满足约束条件时,由于内层取max,因此 β j = s i g n ( h j ( x ) ) ⋅ ∞   ⇒   β j h j ( x ) = ∞ \beta _{j}=sign(h_{j}(x))\cdot \infty \ \Rightarrow\ \beta _{j}h_{j}(x)=\infty βj=sign(hj(x))  βjhj(x)=
  • hj(x) = 0,即满足约束条件时,由于内层取max,因此 ∀   β j ⇒   β j h j ( x ) = 0 \forall\ \beta _{j}\Rightarrow\ \beta _{j}h_{j}(x)=0  βj βjhj(x)=0

        ※ 满足约束条件则是取0,不满足则是取 ∞,因此必须满足下式才有意义:
                                在这里插入图片描述


对偶问题

 
作用:原问题的 关于x 的最小化 转化为了 对偶问题关于α、β的最大化
                  在这里插入图片描述


KKT条件

                  在这里插入图片描述

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
拉格朗日乘子法是一种优化算法,应用于具有约束条件的优化问题。它的原理是基于拉格朗日乘子的概念,在求解有约束问题的时候,将约束条件转化为目标函数的一部分,通过求解该新的目标函数,得到问题的最优解。 在使用拉格朗日乘子法时,首先根据问题的约束条件构造拉格朗日函数。拉格朗日函数是由目标函数和约束条件组成的,目标函数会被调整为加入拉格朗日乘子与约束条件的乘积,同时每个约束条件都会有一个对应的拉格朗日乘子。然后,通过求取拉格朗日函数的偏导数,将其等于0,可以得到一组方程,包括目标函数的梯度和约束条件的梯度。将这些方程联立求解,就可以得到问题的最优解。 对于拉格朗日函数的求解,可以采用数值方法,例如使用fmincon算法。fmincon是一种非线性约束最小化算法,可以求解具有非线性约束的优化问题。它的实现基于拉格朗日乘子法,通过迭代的方式逼近最优解。在每一次迭代中,通过求解一组子问题,不断调整拉格朗日乘子的值,直到找到最优解为止。 总之,拉格朗日乘子法是一种基于拉格朗日函数的优化算法,通过将约束条件转化为目标函数的一部分,再利用数值方法求解最优解。而fmincon算法则是一种具体的数值方法实现,可以应用于求解具有非线性约束的优化问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值