SVM笔记(三) 线性可分支持向量机


预备

适合场景

如果训练输入线性可分,通过应间隔最大化学习得到的线性分类器称为线性可分支持向量机。
假设特征空间上的训练数据集:

T={(x1,y1),(x2,y2),...,(xN,yN)}

其中 xi 表示第i个特征向量, yi{+1,1} xi 的类标记。
学习目标是在特征空间找到一个分离超平面:
wx+b=0

可以将正负样例分开,即正负样例分布在超平面的两侧。

函数间隔和几何间隔

定义超平面关于训练数据集T的函数间隔为超平面 (w,b) 关于T中所有样本点的函数间隔最小值

γ=min1,2,...,Nγi

其中 γi=yi(wxi+b)
定义超平面关于训练数据集T的几何间隔为超平面 (w,b) 关于T中所有样本点的几何间隔最小值
γ=min1,2,...,Nγi

其中 γi=yi(w||w||xi+b||w||)
几何间隔的物理意义是指点到超平面的距离,函数间隔则会随着 w b成比例的缩放而改变。

构建目标函数

目标是找到能够正确划分训练数据集并且几何间隔最大的分离超平面。直观上面理解就是距离分界面最近的距离最大化。可以表示成如下形式:

maxw,bγ

s.t.yi(w||w||xi+b||w||)γ,i=1,2,...,N

基于几何间隔和函数间隔的关系,上式等价于
maxw,bγ||w||

s.t.yi(wxi+b)γ,i=1,2,...,N

考虑到以 λ 等比例改变 w b,对于上式没有影响,这里选择固定一个 λ 使得 γ=1 ,那么上式等价于:
minw,b12||w||2

s.t.yi(wxi+b)10,i=1,2,...,N

根据上式的最优解 w b 可以构建出分离超平面和分类决策函数如下:
wx+b=0

f(x)=sign(wx+b)

训练数据集中的样本点中与分离超平面距离最近的样本点称为支持向量,对应于约束条件中的等号,即
yi(wxi+b)1=0

对应 y={1,+1} ,支持向量分布在两条超平面上面:
(wxi+b)1=0

(wxi+b)+1=0

Alt text
所以SVM分类中只有支持向量对应的实例在分类中起作用,其他实例点并没有作用。

求解的对偶算法

使用拉格朗日对偶性对原始问题求解。首先引入拉格朗日乘子 αi0,i=1,2,...N ,构建拉格朗日函数:

L(w,b,α)=12||w||2i=1Nαiyi(wxi+b)+i=1Nαi

其中, α=(α1,α2,...,αN)T 称为拉格朗日乘子向量。
原始问题对应的对偶问题如下:
maxαminw,bL(w,b,α)

根据 L(w,b,α) 对于 w b的偏导为0,可将原始问题转化为:
minα12i=1Nj=1Nαiαjyiyj(xixj)i=1Nαi

i=1Nαiyi=0

αi0,i=1,2,...,N

假设 α=(α1,α2,...,αN)T 是上面问题的最优解,那么:
w=i=1Nαiyixi

选择一个下标j,使得 αj>0 ,可得:
b=yji=1Nαiyi(xixj)

根据KKT互补条件可知, αi>0 对应的实例为支持向量。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值