支持向量机Support Vector Machine

在样本空间中,划分超平面的方程描述如下:

wTx+b=0 w T x + b = 0
其中 w为法向量,决定了超平面的方向,b为位移项,决定了超平面与原点的距离。

样本空间的点x到这个划分超平面距离为(x’为x在超平面上的投影) :

d=w||w||(xx)=wTxwTx||w||=|wTx+b|||w|| d = w | | w | | ( x − x ′ ) = w T x − w T x ′ | | w | | = | w T x + b | | | w | |

很明显,不同的超平面方向和位移项对分类鲁棒性不同,一般而言其间距(margin)越宽泛化能力也更好。
这里写图片描述
对于正确分类的样本,总有:

{wTxi+b>0,wTxi+b<0,yi=+1;yi=1 { w T x i + b > 0 , y i = + 1 ; w T x i + b < 0 , y i = − 1

且存在缩放系数 w=ζw w = ζ w 使下式成立:

{wTxi+b>0,wTxi+b<0,yi=+1;yi=1(1) { w T x i + b > 0 , y i = + 1 ; ( 1 ) w T x i + b < 0 , y i = − 1

如图一中正好处于边界上使得等号成立的样本点被称为 支持向量(SV: Support Vecto)。

易得灰色间隔的宽度为 21||w|| 2 ⋅ 1 | | w | | 优化的问题是改变w,b的值使得正确分类的同时间距最大:

maxw,b21||w||s.t.yi(wTxi+b)>=1(1) max w , b 2 ⋅ 1 | | w | | s . t . y i ( w T x i + b ) >= 1 即 ( 1 ) 式 表 示 正 确 分 类

上式等价于 :
minw,b12||w||(2)s.t.yi(wTxi+b)>=1 min w , b 1 2 ⋅ | | w | | ( 2 ) s . t . y i ( w T x i + b ) >= 1

虽然这是一个凸优化(二次导数>=0)问题,但是涉及多个变量求解较慢,引入拉格朗日乘子:
L(w,b,a)=12||w||+imai(1yi(wTxi+b)) L ( w , b , a ) = 1 2 ⋅ | | w | | + ∑ i m a i ( 1 − y i ( w T x i + b ) )

注意到上式中 1yi(wTxi+b)<=0 1 − y i ( w T x i + b ) <= 0 ,若添加约束条件 ai>=0 a i >= 0 则后半部分始终<=0,即:
maxaL(w,b,a)<=12||w||s.t.ai>=0 max a L ( w , b , a ) <= 1 2 ⋅ | | w | | s . t . a i >= 0

可以看到拉格朗日乘子法就是: g(x)=f(x)+ai(ai>=0)hi(x) g ( x ) = 原 函 数 f ( x ) + ∑ a i ( a i >= 0 ) ∗ 约 束 h i ( x )

也就是说求 minw,b12||w|| min w , b 1 2 ⋅ | | w | | 相当于求 minw,b(maxaL(w,b,a)) min w , b ( max a L ( w , b , a ) )

利用对偶问题,易证明下面的(3)式始终成立,那么即时(3)式的右边取最大值,不等式也依然成立即(4)式成立。
这里写图片描述

对偶问题呢?因为在约束面上当连续可导时,当取等最大或最小值时导数一定为0。而且利用偏导都为0得到的式子带入乘子式可以消去一部分变量,使得计算简单化。

例如令L(w,b,a)求偏导得到:

Lw=aiyixi0=aiyi ∂ L ∂ w = ∑ a i y i x i 0 = ∑ a i y i

带入可得 minw,bL(w,b,a)=ai1/2|aiyixi|2 min w , b L ( w , b , a ) = ∑ a i − 1 / 2 ∑ | a i y i x i | 2 。发现只有一个变量a。也就是说 如果利用 minw,bL(w,b,a) min w , b L ( w , b , a ) 求偏导为0可能消掉2个变量,而利用 maxaL(w,b,a) max a L ( w , b , a ) 只能消掉一个变量

只剩下一个变量a那么求下式也就比较简单了:

maxa(minw,bL(w,b,a))=maxaai12imjmaiajyiyjxTixj max a ( min w , b L ( w , b , a ) ) = max a ∑ a i − 1 2 ∑ i m ∑ j m a i a j y i y j x i T x j
另外需要满足的条件(KKT)是:
yi(wxi+b)>=0;ai>=0;ai[yi(wxi+b)1]=0; { y i ( w x i + b ) >= 0 ; 正 确 分 类 约 束 a i >= 0 ; 拉 格 朗 日 乘 子 系 数 约 束 a i [ y i ( w x i + b ) − 1 ] = 0 ;
不等式是若对偶关系,当等号成立时是强对偶关系,而且等号应该是在间距的边界上成立。因此最后一个是 最值在边界上的约束,如样本点不在边界上a_i=0忽略其影响,否则若在边界上必有y_i(wx_i+b)-1=0,其影响因子a_i可不为0。

对偶的理解: 几何含义如下, maxL m a x L 就是把其和w绑在一块(等于情况)求最大值,再把w往左移( minmaxL m i n ( m a x L ) ),而max L (min w)则是先左移了w再把L从左往w靠。计算的角度来说则是偏导为0带入消元法。
这里写图片描述

可以参考快速排序,选定基准点之后,不管怎么从左边靠近基准,也总是小于右边往基准遍历的数,只有当两者与边界(基准)时等号成立。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值