支持向量机

支持向量机(SVM)是一种分类模型,通过最大化间隔来找到最佳超平面。在解决线性可分问题时,SVM采用硬间隔最大化,而在面对非线性问题时,它使用核技巧和软间隔最大化。SVM的优化问题可转换为求解凸二次规划,其对偶问题通过拉格朗日乘子和核函数简化。常见的核函数有多项式和高斯核。此外,序列最小优化(SMO)算法被用来高效地求解大规模SVM问题。
摘要由CSDN通过智能技术生成

支持向量机(SVM)是一种二类分类模型。基本模型是定义在特征空间上的间隔最大的线性分隔器,间隔最大使它有别于感知机——误分类点到超平面S的总距离最小


核技巧使它成为实质上的非线性分类器。间隔最大化可形式化为一个求解的凸二次规划,也等价于正则化的合页损失函数的最小化问题——求解凸二次规划的最优化算法



线性可分支持向量机



分离超平面为: wx+b=0
分类决策函数: f(x)=sign(wx+b=0)


函数间隔与几何间隔

在超平面 wx+b=0 确定的情况下,l wx+b l能够表示点x距离超平面的远近.而 wx+b 与符号与类标记y的符号是否一致能够表示分类是否正确。所以可用 y(wx+b) 来表示分类的正确性及确信度—等价于l wx+b l
这就是函数间隔,定义:
γi=yi(wxi+b)

i=1,….,N

γ=minγi


若对分离超平面的法向量w加某些约束,如规范化, w=1 ,使得间隔是确定的,此时函数间隔为几何间隔

几何间隔定义
γi=yi(wwxi+bw)
i=1,….,N

γ=minγi



(硬)间隔最大化

对线性可分的训练数据集而言,线性可分分离超平面有无穷多个(等价于感知机),但是几何间隔最大的分离超平面是唯一的.这里的间隔最大化又称为硬间隔最大化(与将讨论的训练数据集近似线性可分的软间隔最大化相对应)

最大间隔分离超平面,表示为下面的约束最优化问题
maxw,bγ
s.t. yi(wwxi+bw)>=γ,i=1,2,....,N
可改写为
maxw,bγw
s.t. yi(wxi+b)>=γ,i=1,2,....,N


然而函数间隔γ并不影响最优化问题的解(因为有 w 的存在),令γ=1最后改写为
minw,bw22
s.t. yi(wxi+b)1>=0,i=1,2,....,N









算法(线性可分支持向量机学习算法——最大间隔法)

1) minw,bw22
s.t. yi(wxi+b)1>=0,i=1,2,....,N

2)利用拉格朗日算法整合函数求偏导等于0,得到参数即可


最大间隔分离超平面的存在且唯一



支持向量和间隔边界


支持向量是使约束条件式等号成立的点,即

yi(wxi+b)1=0


这里写图片描述

yi=+1 的正例点,支持向量在超平面: H1:wxi+b=1
yi=1 的负例点,支持向量在超平面: H1:wxi+b=1

间隔边界即: 2w


给个例子,二维情况

这里写图片描述



学习的对偶算法


应用拉格朗日对偶性,通过求解对偶问题得到原始问题的最优解
因为:一是对偶问题往往更易求解;二是引进核函数,今儿推广非线性分类问题


引进拉格朗日乘子αi>=0,i=1,2,…,N,定义拉格朗日函数:
L(w,b,α)=w22Ni=1αiyi(wxi+b)+Ni=1αi
α=(α1,α2,...,αN)T 为拉格朗日乘子向量
根据拉格朗日对偶性,原始问题的对偶问题是极大极小问题:
max(对α)min(对w,b)L(w,b,α)


得到下面与之等价的对偶最优化问题:
minα12Ni=1Nj=1αiαjyiyj(xixj)Ni=1αi
s.t. Niαiyi=0
αi>=0,i=1,2,....,N



定理,设 α=(α1,α2,...,αl)T 是对偶最优化问题—上述等价问题 的解,则存在下标 j,使得 αj>0 ,并按下式求得原始最优化问题的解 w,b :


w=Ni=1αiyixi
b=yjNi=1αiyi(xixj)



算法(线性可分支持向量机学习算法)

1)构造并求解约束最优化问题
minα12Ni=1Nj=1αiαjyiyj(xixj)Ni=1αi
s.t. Niαiyi=0
αi>=0,i=1,2,....,N
求得最优解 α=(α1,α2,...,αN)T .

2)计算
w=Ni=1αiyixi
并选择 α 的一个正分量 αj >0计算
b

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值