SVM 透彻理解与分析

hit2015spring

欢迎关注我的博客:http://blog.csdn.NET/hit2015spring

支持向量机问题
问题先按照几何间隔最大化的原则引出他的问题为

minw,b12w2
s.t.yi(wTxi+b)1,i=1,2,,m

上面的约束条件就是一个不等式约束,
可以写成
01yi(wTxi+b),i=1,2,,m

这个是SVM的基本型,或者说是原始问题,寻找这个问题的解法就是需要一些数学的理论,当然在寻找这个解法的过程中,就陆续展开了对于SVM中条件的物理含义的一些解释。

解决该问题,用拉格朗日乘子法和KKT条件导出他的对偶问题,通过解决他的对偶问题,从而解决原始问题。这里面包含的知识有:拉格朗日乘子,kkt条件,对偶理论,凸优化,线性代数,高等数学。当然上面这些是理论上的证明解的存在和解的方向,在求解出真正能用的模型还需要数值分析的一些优化方法,如:牛顿法,梯度下降。。。。。。

首先解决引出他的对偶问题:

对它引入拉格朗日乘子,参考KKT条件和拉格朗日乘子法即对上式添加拉格朗日乘子 αi0 该问题的拉格朗日函数可以写成:
L(w,b,α)=12w2+i=1mαi(1yi(wTxi+b))

对偶问题

先定义一个概念:Wolfe对偶:定义问题 (1)(3) 是凸优化问题 (4)(5) 的对偶

maxα,xxL(x,α)(1)

s.t.xL(x,α)=0(2)

α>0(3)

这里的 L(x,α) f(x) 的拉格朗日函数

minf(x)(4)

s.t.ci(x)0,i=1,2,3,p(5)

再定义一个概念:约束规格:
考虑一般约束问题

minf(x)s.t.c(x)=0c(x)0(6)

在式(6)的可行域 D={ x|ci(x)0,i=1,,p;ci(x)=0,i=p+1,,p+q} ,在这 p+q 个约束函数 c1(x),,cp+q(x) 都是可微函数,引进下列两种对约束的限制性条件(约束规格)
1、线性条件: p+q 个约束函数都是线性函数
2、梯度无关条件:梯度向量集 { ci(x¯)|iA¯} 线性无关,其中 A¯ x¯ 处的有效集

在这里引入一个定理: Wolfe对偶定理:
考虑连续可微的凸优化问题 (4)(5) ,其中 f 和每一个 ci 都是连续可微的凸函数,且定义约束规格中的任意一个约束规格成立,则有以下的:
(1)若原始问题 (4)(5) 有解,则它的Wolfe对偶问题 (1)(3) 有解
(2)若原始问题和它的Wolfe对偶问题分别有可行解 x¯α¯ ,则这两个解分别为原始问题和对偶问题最优解的充要条件是它们相应的原始问题和对偶问题的目标函数值相等

对其原始问题引入式 (1)(3) 中的对偶问题(拉格朗日函数的极大极小)
令拉格朗日函数对 w,b 求偏导数,并令他们等于0

w=i=1mαiyixi0=i=1mαiyi(7)

把式(7)中的两个代入原始的拉格朗日函数可得到式:

12w2w2+i=1mαi+i=1mαiyib(8)

故得到了SVM基本型的对偶问题为:

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值