优化理论系列1——拉格朗日对偶及强弱定理证明（一）

最新推荐文章于 2024-07-19 15:37:59 发布

置顶

threejin_DUT

最新推荐文章于 2024-07-19 15:37:59 发布

阅读量1w

点赞数 1

分类专栏：优化算法机器学习文章标签： svm 优化

本文链接：https://blog.csdn.net/threejin_DUT/article/details/53543976

版权

本文探讨了优化问题中的拉格朗日对偶性，特别是在支持向量机（SVM）中的重要性。通过对弱对偶问题和强对偶定理的证明，阐述了对偶问题在解决原问题困难时的优势。文章详细解释了对偶间隙的概念，并提供了强对偶定理的直观理解与证明，强调了在存在等式约束时，如果目标函数和约束是凸函数，对偶间隙将消失。

摘要由CSDN通过智能技术生成

引言

–

首先要明白为什么要引入对偶问题，或者说为什么要将求解原问题转化为其求解对偶问题。

答：这是因为有些优化问题的原问题很难求解或者是原问题无法用现有的优化方法求解，但其对偶优化问题容易求解。所以在讲到SVM(Support Vector Machines)，必定要提到Lagrange Dual问题，而且转化为对偶问题后能引入Kernel Fuction，也就是所谓的核函数。

对偶问题在SVM优化中的地位如此重要，而强弱对偶定理在对偶优化问题又占有重要的地位。一般的机器学习在讲到SVM部分时一般只讲如何将最大间隙问题化为其对偶问题，而对对偶问题中的强弱对偶定理一般只给出结论，比如Andrew NG的机器学习公开课讲义。笔者在最优化方法课程中恰好也学到了对偶理论，一般教科书对强对偶定理的初等证明又晦涩难懂，所以想写一下关于此定理相对通俗易懂的证明，也顺便梳理一下自己对强定理证明的理解。

1.优化原问题和其对偶问题

一般带约束优化问题如下：

f i n d x ⃗ \in R n m i n f (x ⃗) s . t g i (x ⃗) \leq 0, i = 1, . . ., k . h j (x ⃗) = 0, j = 1, . . ., l .

$\\find\qquad \vec x\in R^{n}\\ min\qquad f(\vec x)\\ s.t\qquad g_i(\vec x)\leq0,\ i=1,...,k.\\ \qquad\qquad h_j(\vec x)=0,\ j=1,...,l.$
其对偶(Lagrange Dual)问题如下：