拉格朗日对偶性

Wang CS

于 2019-07-02 12:56:27 发布

阅读量274

点赞数

分类专栏：机器学习文章标签：拉格朗日支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41048094/article/details/94435765

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.原始问题

假设 f(x) ， $g_{i}(x)$ ， h_j(x) 是定义在 R^n 上的连续可微函数，约束最优化问题(原始问题)如下：

$\min_{x}f(x)$

s.t. $g_i(x)\leq 0$ i=1,2,...,k

h_j(x)=0 j=1,2,...,l

引进广义拉格朗日函数：

$L(x,\alpha ,\beta ) = f(x)+\sum_{j=1}^{l}\beta _{j} h_{j}(x)+\sum_{j=1}^{k}\alpha _{i}g_{i}(x)$

$\alpha_{i}\geq 0$ ， $\beta _{j}$ 是拉格朗日乘子。

关于的函数：

$\theta _p(x) = \max_{\alpha, \beta }L(x,\alpha ,\beta )$

所以：

${\color{Red} {\color{Red} }\min_{x}f(x) = \min_{x}\max_{\alpha, \beta }L(x,\alpha ,\beta )}$

原始问题就是广义拉格朗日的极小极大问题(与原问题等价)，是关于变量的函数。

定义原始问题的最优值：

$p^*=\min_{x}\theta _p(x)=\min_{x}\max_{\alpha, \beta }L(x,\alpha ,\beta )$

2.对偶问题

定义：

$\theta _D(\alpha ,\beta ) = \min_xL(x,\alpha ,\beta )$

极大化：

$\max_{\alpha ,\beta }\theta _D(\alpha ,\beta ) = \max_{\alpha ,\beta }\min_xL(x,\alpha ,\beta )$

s.t. $\alpha _i\geq 0$ i=1,2,...,k

形成广义拉格朗日的极大极小问题（对偶问题），是关于变量 $\alpha ,\beta$ 的函数。

定义对偶问题的最优值：

$d^*=\max_{\alpha ,\beta }\theta _D(\alpha ,\beta ) = \max_{\alpha ,\beta }\min_xL(x,\alpha ,\beta )$

3.原始问题与对偶问题的关系

定理1：

$d^*= \max_{\alpha ,\beta }\min_xL(x,\alpha ,\beta )\leq \min_{x}\max_{\alpha, \beta }L(x,\alpha ,\beta )=p^*$

推论1：

设 $x^*,\alpha ^*,\beta ^*$ 分别是原始问题和对偶问题的可行解，并且 d^*=p^* ，则 $x^*,\alpha ^*,\beta ^*$ 分别是原始问题和对偶问题的最优解。这说明可以用解对偶问题替代解原始问题。

定理2：

考虑原始问题和对偶问题，假设

（1）函数 f(x) 和 g_i(x) 是凸函数

（2） h_j(x) 是仿射函数

（3）假设约束 $g_i(x)\leq 0$ 严格成立

则存在 $x^*,\alpha ^*,\beta ^*$ ，使得 x^* 是原始问题的解， $\alpha ^*,\beta ^*$ 是对偶问题的解，并且：

$d^*=p^*= L(x^*,\alpha ^*,\beta ^*)$

定理3：

在定理2的（1）（2）（3）条件下， $x^*,\alpha ^*,\beta ^*$ 分别是原始问题和对偶问题的解的充分必要条件是 $x^*,\alpha ^*,\beta ^*$ 满足KKT条件：

$\triangledown _xL(x^*,\alpha ^*,\beta ^*)=0$

$\triangledown _\alpha L(x^*,\alpha ^*,\beta ^*)=0$

$\triangledown _\beta L(x^*,\alpha ^*,\beta ^*)=0$

$\alpha _i^*g_i(x^*)=0$

$g_i(x^*)\leq0$

$\alpha _i^*\geq 0$

h_j(x^*)=0

总结：

1.原始问题可以写成广义拉格朗日的极小极大问题，其对偶问题是广义拉格朗日的极大极小问题，问题间的转换实质是函数自变量的转换。

2.如果满足定理2，则可以通过解对偶问题得到原始问题的解，因为有时候解对偶问题比解原始问题容易。

3.在定理二成立的情况下，定理3给出了寻找最优解的具体方法，即套用KKT条件，解方程组。

参考:《统计学习方法》李航

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Wang CS CSDN认证博客专家 CSDN认证企业博客

码龄7年

32: 原创

29万+: 周排名

3万+: 总排名

8万+: 访问

: 等级

873: 积分

200: 粉丝

226: 获赞

4: 评论

333: 收藏

私信

关注

分类专栏

深度学习
机器学习 2篇

最新评论

深度学习调参指南
weixin_46829268: 太好了，找到这本书了
MATLAB读取每行文本并提取字符串后的数字
lalalalauuhad: 有一个问题，如果没有匹配到，for循环最后两行会出错，应该加一个是否是空数组判断。如果string1：后面还有空格可以加上（\s+）增加通用匹配性
MATLAB读取每行文本并提取字符串后的数字
CSDN-Ada助手: 恭喜您在博客中分享了关于MATLAB读取文本并提取数字的技巧！这对于需要处理大量数据的人来说非常有用。不过，我想建议您在下一篇博客中可以分享一些实际应用场景，或者是如何将这些提取的数字进行进一步的分析和处理，这样会更加丰富您的内容。期待您更多的创作！
信号相干解调
CSDN-Ada助手: 恭喜您创作了第13篇博客！标题“信号相干解调”听起来非常有趣。您对这个主题的探索一定非常深入，让读者受益匪浅。希望您能继续保持创作的热情和努力，为我们带来更多精彩的分享。鉴于您对信号相干解调的研究，我想提出一个可能的创作建议，那就是探讨不同解调技术在实际应用中的适用性和性能对比。您可以分享各种解调技术的原理、优缺点，以及它们在不同领域中的应用案例。这样的文章将对读者更加有指导意义，也能进一步扩展您的专业知识和影响力。期待您未来更多精彩的博客！
Hyperopt 超参数调优
ClGG123: 很专业

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。