支持向量机(SVM)第一章----线性可分

最新推荐文章于 2024-06-11 15:17:35 发布

Doooer

最新推荐文章于 2024-06-11 15:17:35 发布

阅读量630

点赞数

分类专栏：机器学习算法总结

本文链接：https://blog.csdn.net/YQMind/article/details/80339345

版权

以下参考周老师《机器学习》。

SVM会涉及到硬间隔、软间隔、核函数等概念，别怕，我们一步一步推进，保证可以有一个清晰的认识。

Step 1: 我们从简单的情况入手—>线性可分，即在训练集上一定可以找到一个划分超平面，将两种类别的样本分开。
(1) 问题描述：
将两种类别的样本完全分开的超平面有很多，那么哪一个超平面是最好的？

从上图可以看出，中间加粗的超平面更好，因为它不仅分对了训练样本，还对训练样本有很大的包容性，也就是说即使训练样本发生了一定扰动，该超平面仍旧可以将它分对。

(2) 划分超平面如何表示？
可以通过如下线性方程组来描述：
$w^Tx + b =0$ ，其中 $w=(w_1;w_2;...;w_d) 为法向量，d是样本维度$ ， $b$ 是位移量。
点 $x$ 到平面的距离公式：
$dist = \frac{|w^Tx+b|}{||w||}$

(3) 根据(1)中，我们可以看出我们希望样本中到超平面的最近距离最大化，用数学公式描述如下：
$\arg \max\limits_{w,b} (\min\limits_i \frac{|w^Tx_i+b|}{||w||})$
可以看到，如果找到最优的 $w,b$ ,我们将 $w,b$ 任意缩放 $\alpha$ 后，仍然是最优的,因为分子分母都有 $\alpha$ ,消去了。
通过一定缩放，我们令 $\min\limits_i |w^Tx_i+b|=1$
目标就变成了：
$\arg \max\limits_{w,b} \frac{1}{||w||}, s.t. y_i(w^Tx_i+b)\geq1,i=1,2,...,n$
我个人对这里目标函数的得出有点不是很透彻，起码我没有办法一下子跳到那个公式。需要绕一个大弯，我们是想从无数个 $w,b$ 中，找到最小距离最大化的 $w,b$ ,对于一对 $w,b$ ,将它任意放大缩小，这个超平面并没有发生变化，仍是同一个超平面。既然这样，我们就令

最低0.47元/天解锁文章

Doooer

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
支持向量机(SVM)第一章----线性可分

以下参考周老师《机器学习》。SVM会涉及到硬间隔、软间隔、核函数等概念，别怕，我们一步一步推进，保证可以有一个清晰的认识。Step 1: 我们从简单的情况入手—&gt;线性可分，即在训练集上一定可以找到一个划分超平面，将两种类别的样本分开。 (1) 问题描述：将两种类别的样本完全分开的超平面有很多，那么哪一个超平面是最好的？从上图可以看出，中间加粗的超平面更好，因为它不仅...
复制链接

扫一扫

专栏目录