凸优化——详解原函数的对偶函数、对偶问题和共轭函数之间的关系(我尽力了)

一、 原函数的对偶函数和共轭函数

  1. 对偶函数
    原函数 ==> 拉格朗日函数 ==> 对偶函数(拉格朗日对偶函数)
    f 0 f_0 f0 ==>L(x, λ \lambda λ,v) ==>D( λ \lambda λ,v)
    这里就不具体写形式了,一定要搞清楚各个函数的变量是哪些

  2. 共轭函数/函数的共轭
    我一下午花了很多很多时间看勒让德变换,终于搞懂共轭函数是啥了!
    B站此小姐姐的数学实在太好了
    维基-勒让德变换
    f ∗ ( y ) = s u p ( y T x − f ( x ) ) f^*(y)=sup(y^Tx-f(x)) f(y)=sup(yTxf(x))
    (公式我省略了sub下面的定义域,不知道怎么打出来)
    相信很多人看了公式跟我一样是很懵逼的,跟我们以前学的复数共轭完全不一样,有减法而且还有个sub

重点来了(到二之前都是在解释共轭函数):有时候我们不喜欢一个函数里的某些或所有自变量表示,我们就想改变这些自变量而不改变另外一些;这就发生了换元。
而这里——函数共轭,我们不喜欢原函数用某点的横纵坐标(x,y)表示,我们想用函数上某点斜率还有切线的截距表示!前面这句话实在太重要了,看不懂的多看几遍。其实就是换元,但比一般换元难太多了。

所以f(x)会被换成 f ∗ ( p ) f^*(p) f(p)
x是此点横坐标,f(x)是纵坐标
p是此点斜率, f ∗ ( p ) f^*(p) f(p)是截距(只为正的)

截距=斜率*横坐标-f(x) -----------------这边需要好好考虑一下正负问题,因为截距在y轴正还是负半轴得到的结果是不一样的,所以我们加了一个sub取最大,这就不怕结果为负了。因为随着x移动截距是上还是下是变化的,所以我们不能固定的用“斜率*x-f(x)”或反过来**来表示为正的那个
在这里插入图片描述
所以这个时候就有了sub,来取最大,这样就不会有失误了。(在这里我有个为什么不能用绝对值的问题,有懂的大牛告诉我一下)





最后
原函数的对偶函数和共轭函数之间存在着联系,但原函数不同,对应的关系也不同。对偶函数和共轭函数之间的转化很重要的“转换点”是sub和inf的转换,
inf( f ( x ) f(x) f(x))=-sup(- f ( x ) f(x) f(x))


\

二、关于共轭的共轭,对偶的对偶

(这里的对偶是对偶问题而不是对偶函数)
这里要着重说一下:对偶函数对偶问题的区别
它们是非常非常不一样的概念,问题是为了求最值,而函数就是个f
a. 对偶函数很容易理解,就是从拉格朗日函数转换过来的,只跟 λ \lambda λ,v相关的函数,不是一个问题(不需要得到最值什么的
b. 对偶问题是通过性质“ 对偶函数一定小于原问题的最优解 P ∗ P^* P ”,然后我们自然而然想要得到“对偶函数的最大值—— D ∗ D^* D ”,因为这就解决了原问题最小/最好下界的问题!如此一来这不就是个“要求最大值的问题”了吗!
对偶问题是一个凹函数(对偶函数)求最大,定义域还是凸的( λ \lambda λ>=0),那它不就是个秃问题了吗?!(最大化凹=最小化凸)

最后:对偶函数一定是凹函数,但对偶问题是秃问题!

性质:

  1. 函数的共轭一定是凸函数
  2. 函数的对偶问题也一定是凸问题

所以共轭的共轭不一定是原函数,对偶问题的对偶问题也未必是原问题,因为原函数or问题未必是凸
/
/

那如果原函数是凸函数or问题,什么情况下原函数的共轭的共轭是原函数、原问题的对偶的对偶等于原问题?通过以前的课我可以给出其中一个结论,凸函数且闭合它共轭的共轭还等于它自身,而至于后面的问题,
我们下次再说

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值