深入理解SVM

深入理解SVM

martin


SVM核心思想一:最大间隔

对于一个分类算法,想要画出一条决策边界,但是由于决策边界有很多条我们想要通过某种衡量手段来确定一条在此条件下最好的一条决策边界,所以就会有个问题: 于是最大边界应运而生。

svm-1.png-12.4kB

让最大间隔作为衡量一条决策边界的好还的原因是,如果一条决策边界有最大间隔,那么这条决策边界就具有很好的 ,相当于增加了一个缓冲地带,再来一个数据集我可以很从容的包容你进行分类不至于分错类别。

下面讲下最大间隔的概念,如上图,假如存在一条图中的决策边界, A 为边界上的某一点,那么连接原点可以作出通过 A 点的一个向量 u ,找到一个垂直于决策边界的法向量 w ,那么决策边界与虚线的距离 AB 可以用向量 w 与向量 u 的内积来表示,我们知道, w.u 即为向量 u w 上的投影的长度,那么我现在规定一个距离 C 即为间隔,令 wu=C ,当 wu>=C 我就很有自信的认为这一点为正类,当 wu<=C 我就很有自信的认为这一点为负类。我们来换一种形式来表达这个 wu=C 式子:

对于训练集中的正类:

wx++b>=1

对于训练集中的负类:
wx+b<1

我们先将这里的间隔设为1,当然,可以设置为5,10或者50,100等,但通过左右消除都可以变成1,所以这里就是用1来作为间隔距离。


SVM核心思想二:决策公式

y 的取值给出:

y={+1x-1x

对于训练集中的正类:

wx++b>=1

对于训练集中的负类:
wx+b<1

所以我们可以将上面三个公式合并起来得到一个决策公式,来表示对样本的正确分类:

yi(wxi+b)1>=0

而在决策边界的边界上的,可以理解为在 上的点符合下面的公式:

yi(wxi+b)1=0

SVM核心思想三:目标函数

现在我想要求得这条包含两个间隔的“马路”的宽度,所以我分别选取了在路两边上的点, OCOD ,那么这两个向量之差就是”路”的宽度。

svm-2.png-13.4kB

写成公式就是,这里的

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值