拉格朗日对偶问题

一、直观理解拉格朗日乘数法

  1. 只有一个约束条件

image-20220406194958329

能发现,只有当目标函数f(x, y)的梯度方向和约束条件的梯度方向相反时,通过调整 λ \lambda λ才可以使拉格朗日函数对x和y的偏导为0

  1. 有多个约束条件

image-20220406195318701

真正起贡献的梯度其实只有其中两个约束条件的梯度,最后的式子变为下式:

image-20220406195632122

所有的 λ i \lambda_i λi都是大于等于0的:

  • 如果 λ i = 0 \lambda_i=0 λi=0,那么对应的约束条件 g i ( x ) g_i(x) gi(x)是松弛的(约束条件 g i ( x ) g_i(x) gi(x)没有起到作用)
  • 如果 λ i > 0 \lambda_i\gt0 λi>0,那么对应的约束条件 g i ( x ) g_i(x) gi(x)是紧致的(约束条件 g i ( x ) g_i(x) gi(x)起了作用)
  1. 目标函数的最小值在可行域内

image-20220406200150361

此时,所有的约束条件都是松弛的

二、拉格朗日乘数法的不足

求出来的点不一定是最值,有可能是极值或者鞍点

image-20220406200321414

什么时候极值是最值呢?

目标函数是凸函数的时候很有可能是最值

如何解决非凸问题?

求原问题的对偶函数

三、拉格朗日对偶问题

目标函数及其约束条件:

image-20220406200827158

拉格朗日函数:

image-20220406200847388

L ( x , λ , μ ) L(x,\lambda,\mu) L(x,λ,μ)的最小值可以分成两步,先把 x x x看作常量 λ \lambda λ μ \mu μ看作变量,求 L ( x , λ , μ ) L(x,\lambda,\mu) L(x,λ,μ)最大值,再在这个最大值的基础上以 x x x变量 L ( x , λ , μ ) L(x,\lambda,\mu) L(x,λ,μ)最小值

image-20220406201133441


该原问题可以和刚开始求 min ⁡ f 0 ( x ) \min f_0(x) minf0(x)等价,证明如下:

image-20220406201244908

具体解释就是:

  • 当x在可行域内时,显然 ∑ μ i h i ( x ) = 0 \sum\mu_ih_i(x)=0 μihi(x)=0,对任何i来说, ∑ λ i f i ( x ) \sum\lambda_if_i(x) λifi(x)恒小于等于0,它们的最大值也只是0

  • 当x不在可行域内时, ∑ λ i f i ( x ) \sum\lambda_if_i(x) λifi(x)的最大值可以取到无穷大(KaTeX parse error: Undefined control sequence: \and at position 13: \lambda\gt0 \̲a̲n̲d̲ ̲f_i(x)>0), ∑ μ i h i ( x ) \sum\mu_ih_i(x) μihi(x)的最大值也可以取到无穷大( μ i \mu_i μi没要求, h i ( x ) ≠ 0 h_i(x)\neq 0 hi(x)=0),求这些无穷大没意义,因为最后要求最小值,无穷大肯定是不要的

所以:

image-20220406202116805


对偶函数:先把 λ \lambda λ μ \mu μ看作常量 x x x看作变量,求 L ( x , λ , μ ) L(x,\lambda,\mu) L(x,λ,μ)最小值,再在这个最小值的基础上以 λ \lambda λ μ \mu μ L ( x , λ , μ ) L(x,\lambda,\mu) L(x,λ,μ)最大值

image-20220406203135395

image-20220406203342491

其实就是颠倒了一下两者的顺序,对偶问题还有另一种形式:

image-20220406203547456

3.1 对偶问题的特性

无论原问题是什么,它的对偶问题都是凸问题!

解释:

  1. 凸集、凸函数等概念
  2. 拉格朗日对偶问题为什么是凸问题?

凸集、凸函数、凸优化等概念

image-20220406203759147

图1

image-20220406203900074

图2

图2还可以这样表示

image-20220406204110460

图3
  1. 凸集的交集也是凸集
维度交集
1image-20220406204423797
2线image-20220406204452120
3平面image-20220406204541472
4立体图形image-20220406204558408
  1. 半空间也是凸集

    image-20220406204718134

  2. 半空间的交集也是凸集

    以下情况是不可能出现的,C1, C2和C5的交集只有左边那个三角形了右部分不可能存在的

image-20220406204858825

  1. 凸函数

    image-20220406205016473

  2. 凹函数

    image-20220406205024333

  3. 凹凸函数

    image-20220406205228246

  4. 凸优化问题的定义

一个问题的目标函数是一个凸函数可行域是一个凸集,那么这个问题就是一个凸优化问题

3.2 拉格朗日对偶问题为什么是凸问题?

当x确定的时候,假设x*是对偶函数的最优解,

则有:

image-20220406205715453

可以看到:

  1. 变量 λ \lambda λ μ \mu μ都是一阶线性的,目标函数为凸函数
  2. 拉格朗日对偶问题的约束是 λ i ≥ 0 \lambda_i\ge0 λi0,所以它的可行域也是一个凸集

因此:

所以对偶问题一定是凸问题,又因为求的是对偶函数的最大值,所以对偶函数是一个凹函数(凹函数加个负号就是凸函数,注意区分对偶函数和对偶问题的概念)

原问题和对偶问题是否等价?

不一定!

3.3 原问题和对偶问题的等价讨论

拉格朗日函数:

image-20220406200847388

原问题:

image-20220406201133441

对偶问题:

image-20220406203342491

可通过下述推导得到结论:对偶问题的解是原问题的下确界

image-20220406211147531

证明具体看视频吧,理解的不是很透彻

弱对偶关系:P* > D*

强对偶关系:P* = D*

3.4 判断一个问题和它的对偶问题是不是强对偶关系 —— Slater条件(充分条件)

对一个凸优化问题,

image-20220406213520433

存在一个点 x ∈ r e l i n t   D x\in relint\space D xrelint D

使得 f i ( x ) < 0 f_i(x)\lt 0 fi(x)<0,其中 i = 1 , 2 , 3 , . . . , m ,   A x = b i=1,2,3,...,m,\space Ax = b i=1,2,3,...,m, Ax=b

( r e l i n t D relint D relintD表示可行域的相对内部,及x不在边界上)

则该问题一定是一个强对偶关系的问题

3.5 只要是强对偶关系的问题,一定满足KKT条件(必要条件)

对一个凸优化问题,

image-20220406213520433

image-20220406213920780

image-20220406213942308

互补松弛条件的理解见前面关于 λ i \lambda_i λi g i ( x ) g_i(x) gi(x)的松弛和紧致关系

参考视频

“拉格朗日对偶问题”如何直观理解?“KKT条件” “Slater条件” “凸优化”打包理解_哔哩哔哩_bilibili

  • 19
    点赞
  • 86
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VelvetQuilt

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值