深入理解SVM

最新推荐文章于 2022-07-09 16:02:45 发布

ice_martin

最新推荐文章于 2022-07-09 16:02:45 发布

阅读量5k

点赞数 32

分类专栏：机器学习文章标签： SVM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ice_martin/article/details/62219716

版权

深入理解SVM

martin

深入理解SVM

SVM核心思想一：最大间隔

对于一个分类算法，想要画出一条决策边界，但是由于决策边界有很多条我们想要通过某种衡量手段来确定一条在此条件下最好的一条决策边界，所以就会有个问题： $\color{red}{什么样的决策边界才是最好的呢？}$ 于是最大边界应运而生。

svm-1.png-12.4kB

让最大间隔作为衡量一条决策边界的好还的原因是，如果一条决策边界有最大间隔，那么这条决策边界就具有很好的 $\color{red}{鲁棒性}$ ，相当于增加了一个缓冲地带，再来一个数据集我可以很从容的包容你进行分类不至于分错类别。

下面讲下最大间隔的概念，如上图，假如存在一条图中的决策边界， $A$ 为边界上的某一点，那么连接原点可以作出通过 $A$ 点的一个向量 $u$ ，找到一个垂直于决策边界的法向量 $w$ ，那么决策边界与虚线的距离 $AB$ 可以用向量 $w$ 与向量 $u$ 的内积来表示，我们知道， $w.u$ 即为向量 $u$ 在 $w$ 上的投影的长度，那么我现在规定一个距离 $C$ 即为间隔，令 $w\cdot u=C$ ，当 $w\cdot u>=C$ 我就很有自信的认为这一点为正类，当 $w\cdot u<=-C$ 我就很有自信的认为这一点为负类。我们来换一种形式来表达这个 $w\cdot u = C$ 式子：

对于训练集中的正类：

w \cdot x + + b > = 1

$w\cdot x_+ + b >= 1$
对于训练集中的负类：

w \cdot x - + b < - 1

$w\cdot x_- + b < -1$

我们先将这里的间隔设为1，当然，可以设置为5，10或者50，100等，但通过左右消除都可以变成1，所以这里就是用1来作为间隔距离。

SVM核心思想二：决策公式

将 $y$ 的取值给出：

y = {+1 ， x 为 正 类 -1 ， x 为 负 类

$y = \left\{{\text{+1，x为正类}\atop\text{-1，x为负类}}\right.$

对于训练集中的正类：

w \cdot x + + b > = 1

$w\cdot x_+ + b >= 1$
对于训练集中的负类：

w \cdot x - + b < - 1

$w\cdot x_- + b < -1$

所以我们可以将上面三个公式合并起来得到一个决策公式，来表示对样本的正确分类：

y i (w \cdot x i + b) - 1 > = 0

$y_i(w\cdot x_i + b) - 1 >=0$

而在决策边界的边界上的，可以理解为在 $\color{red}{路边}$ 上的点符合下面的公式：

y i (w \cdot x i + b) - 1 = 0

$y_i(w\cdot x_i + b) - 1 =0$

SVM核心思想三：目标函数

现在我想要求得这条包含两个间隔的“马路”的宽度，所以我分别选取了在路两边上的点， $OC，OD$ ，那么这两个向量之差就是”路”的宽度。

svm-2.png-13.4kB

写成公式就是，这里的

最低0.47元/天解锁文章

关注

32
点赞
踩
180

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。