机器学习（西瓜书）学习笔记6——支持向量机

最新推荐文章于 2022-10-28 00:29:13 发布

007djx

最新推荐文章于 2022-10-28 00:29:13 发布

阅读量376

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_22791959/article/details/99414130

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一.首先讲两个概念：间隔和支持向量

对于给定的训练集 $D=\left \{ \left ( x_{1},y_{1} \right ) ,\left ( x_{2},y_{2} \right ) ,...,\left ( x_{m},y_{m} \right ) \right \}$ ，分类学习的目的是在样本空间中找到一个划分超平面，将不同类别的样本分开。这个超平面可能有很多，哪个才是最好的?

图1

由图1显示的例子，有两类样本，有很多个超平面可以将这两类样本完全分开，但是以我们自己的直觉看，处于两类样本中间的超平面应该会更好一些，因为该划分超平面对于训练样本局部扰动的容忍性最好。（现实中的数据距离超平面的距离会更近，在这种情况下，红色那条超平面是分类最准确的超平面），也就是说，这个超平面所产生的分类结果是最鲁棒的，对未见示例的泛化性能最强。

在样本空间中，划分超平面可用如下线性方程来描述：

其中， $\omega$ = $\left (\omega _{1};\omega _{2}...;\omega _{d} \right )$ 为法向量，决定了超平面的方向，b决定了超平面与原点间的距离。所以，超平面由法向量 $\omega$ 和位移 b 确定。样本空间中任意点x到超平面 $\left ( \omega ,b \right )$ 的距离为：