SVM支持向量机学习笔记 _ 1 数学基础
注:本文以及以后出现的变量 x 或其他没有标量角标的变量,除特殊说明外,均为向量。
一、拉格朗日对偶性:
1.无约束的极值优化问题
Fermat引理,其中的核心告诉我们在该点可微的情况下,如果该点为极值点,则其导数必为0。
2.仅含等式约束的优化问题
Lagrange乘子法:
这是一个等式约束的优化问题,构建Lagrange乘子
对每个变量和待求参数分别求偏导就得到了极值点的待求集合。
注:这个方法的理解可以参考下面的文章,讲的比较清楚,在此不再赘述。
深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件
3.含不等式约束的优化问题(主要是Lagrange Duality)
考虑原始问题:
将该问题称为原始最优化问题 p 。
接下来,引进广义拉格朗日函数(generalized Lagrange function)
下面来解释一下我们为什么要构建这个函数:
令
且D为x满足原约束的集合,我们可以很轻松的得到:
则
等式的前一项为D域上的问题,后一项为全局意义上的问题,这样就将原始的最优化问题转化成了极大极小问题,但是我们知道凸优化问题是我们常解决的一类问题,但是极小极大问题未必是凸优化问题。
所以我们下面来考虑极小极大问题的对偶问题:
原极小极大问题为
其对偶问题为:
对于上述两个问题,存在以下三个定理:
令原始问题的最优值为 d∗ ,对偶问题的最优值为 p∗ ,这里的原始问题指的是对偶问题对应的原始问题,不是整篇文章最开始的原始问题(虽然结果是一致的)。
1.假定原始问题和对偶问题均有最优值,则
d∗⩽p∗
2.考虑原始问题和对偶问题,假定函数
f(x)
和
ci(x)
为凸函数,
hj(x)
为仿射函数;并且假设不等式约束
ci(x)
是严格可行的,即存在
x
,对所有的
3.对原始问题和对偶问题,假设函数
f(x)
和
ci(x)
为凸函数,
hj(x)
为仿射函数;并且假设不等式约束
ci(x)
是严格可行的,则
x∗,α∗,β∗
分别为原始问题和对偶问题的解的充分条件是
x∗,α∗,β∗
满足KKT条件:
本文内容参考李航老师的《统计学习方法》