分类算法(二):SVM的原理

支持向量机基本模型定义为特征空间上的间隔最大的线性分类器。而它的学习策略为最大化分类间隔,最终可转化为凸二次规划问题求解。SVM为非参数模型。SVM的损失函数采用的是hingeloss。在学习分类器的时候,SVM只考虑与分类最相关的少数支持向量点。

应用:解决二分类或者多分类问题

最优分类超平面

最优分类超平面–尽可能的远离所有类别的数据点,对已知和未知数据都能准确地分类,因而,我们需要寻找有最大间隔的最优超平面。

定义超平面:

w^{T}x=0

在二维空间里面,假设两个向量X = \left( \begin{array}{ccc} -b \\ -a \\ 1 \end{array} \right)     W = \left( \begin{array}{ccc} 1 \\ x \\ y \end{array} \right) 

可以得到:

解得,在二维平面的表示方式 y=ax+b 等价于w^{T}x=0

间隔与支持向量

正交投影:

   

可以得到向量 z=(u⋅x)u 是向量x在y上的正交投影。  

由上可得:

点A(3,4)和超平面之间的距离||p||,p=(u⋅a)u

因而,空间中任一点w到超平面(w,b)的距离可以写成:r = \frac{w^{T} }{\left \| w \right \|} \cdot x=\frac{\left | w^{T}x+b \right| }{\left \| w \right \|}

支持向量的定义:训练样本使得\left | w^{T}x_{i}+b \right |=1成立,即样本在间隔边界处。

目标函数:我们需要最大化间隔,两个不同类支持向量到超平面的距离\frac{2}{\left \| w \right \|}

即可得到约束条件 

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值