SVM总结

SVM(支持向量机)

1.支持向量

1.1 线性可分
首先咱们先来了解下什么是线性可分
在这里插入图片描述
在二维空间上,两类点被一条直线完全分开叫做线性可分。

严格的数学定义是:
D0与D1是 n 维欧氏空间中的两个点集。如果存在 n 维向量 w 和实数 b,使得所有属于D0的点x都有wx + b >0,而对于所有属于 D1的点x则有wx+b<0,则咱们称为D0与D1线性可分。

1.2 最大间隔超平面
从二维扩展到多维空间中时,将D0与D1完全划分开的wx+b=0就成了一个超平面。
为了使这个超平面更具鲁棒性,我们会去找最佳超平面,以最大间隔把两类样本分开的超平面,也称之为最大间隔超平面。
两类样本分别分割在该超平面的两侧;
两侧距离超平面最近的样本点到超平面的距离被最大化了。
1.3 支持向量
在这里插入图片描述
样本中距离超平面最近的一些点,这些点叫做支持向量。

1.4 SVM优化问题
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.对偶问题

2.1 拉格朗日乘数法
1.等式约束优化问题
拉格朗日程数法是等式约束优化问题:
在这里插入图片描述
2.不等式约束优化问题
而咱们现在面对的是不等式优化问题,针对这种情况其主要思想是将不等式约束条件转变为等式约束条件,引入松弛变量,将松弛变量也是为优化变量。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
也就是说,最大的里面挑出来的最小的也要比最小的里面挑出来的最大的要大。这关系实际上就是弱对偶关系,而强对偶关系是当等号成立时,即:
在这里插入图片描述
如果f 是凸优化问题,强对偶性成立。而我们之前求的 KKT 条件是强对偶性的充要条件

3. SVM优化

我们已知 SVM 优化的主问题是:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
可以看出来这是一个二次规划问题,问题规模正比于训练样本数,常用 SMO(Sequential Minimal Optimization) 算法求解。

SMO(Sequential Minimal Optimization),序列最小优化算法,其核心思想非常简单:每次只优化一个参数,其他参数先固定住,仅求当前这个优化参数的极值。我们来看一下 SMO 算法在 SVM 中的应用。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4. 软间隔

4.1 解决问题
在实际应用中,完全线性可分的样本是很少的,如果遇到了不能够完全线性可分的样本,应该怎么办?比如下面这个:
在这里插入图片描述
于是咱们就有了软间隔,相比于硬间隔的苛刻条件,咱们允许个别样本点出现在间隔带里面,比如:
在这里插入图片描述
允许部分样本点不满足约束条件:
在这里插入图片描述
在这里插入图片描述
4.2 优化目标及求解
增加软间隔后咱们的优化目标变成了:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这边要注意一个问题,在间隔内的那部分样本点是不是支持向量?
在这里插入图片描述

5. 核函数

5.1 线性不可分
我们刚刚讨论的硬间隔和软间隔都是在说样本的完全线性可分或者大部分样本点的线性可分。

但我们可能会碰到的一种情况是样本点不是线性可分的,比如:
在这里插入图片描述
这种情况的解决方法就是:将二维线性不可分样本映射到高维空间中,让样本点在高维空间线性可分,比如
在这里插入图片描述
在这里插入图片描述
5.2 核函数的作用
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6. 优缺点

**6.1 优点**有严格的数学理论支持,可解释性强,不依靠统计方法,从而简化了通常的分类和回归问题;能找出对任务至关重要的关键样本(即:支持向量);采用核技巧之后,可以处理非线性分类/回归任务;最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。**6.2 缺点**训练时间长。当采用 SMO 算法时,由于每次都需要挑选一对参数,因此时间复杂度为O(N的平方)

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值