SVM原理入门

最新推荐文章于 2022-10-15 23:15:52 发布

qq_43133135

最新推荐文章于 2022-10-15 23:15:52 发布

阅读量293

点赞数

分类专栏：人工智能数据处理文章标签：支持向量机算法机器学习

本文链接：https://blog.csdn.net/qq_43133135/article/details/123492783

版权

人工智能同时被 2 个专栏收录

20 篇文章 2 订阅

订阅专栏

数据处理

5 篇文章 0 订阅

订阅专栏

支持向量机

我们对支持向量机的理解，可以用二维来说明，比如需要找一条最优的直线(超平面)将两类点分开：
在这里插入图片描述
不过这里需要定义一下说明是最优，那就是：

使得离直线较近的点具有最大间距

如下有5个蓝色样本，标记为y =1，紫色有5个样本，标记为 y=-1，共10个样本： ${(x₁ ,y₁) , (x₂,y₂) .........(x_{10},y_{10}) \}$ 。
在这里插入图片描述
平面（分割线）为 $w^T\cdot x+b\cdot 1=0$

我们都知道，该方程相当于齐次向量 $[x, 1]$ 在某个向量 $[w, b]$ 上的投影，这点和感知机异曲同工。
其中 $[w, b]$ 这个向量恰好与图中所示的直线对应齐次向量 $[x, 1]$ 垂直，故内积为0

样本点到超平面的距离即为 $x_i$ 在向量 $w$ 的投影再加上b，即 $w^T\cdot x+b\cdot 1$ ，不过我们知道这个投影值可能是负的，我们再加一个符号纠正项即可： $y_i\times y(x_i)$

式中 $y_i$ 的作用，便是纠正 $y(x_i)$ 的符号，使得当 $x_i$ 投影结果 $y(x_i)$ 为负数时，由于 $y_i=-1$ ，使得负负得正。

点到平面距离定义

所以我们可以定义出任意样本点的距离，为超平面(w, b)关于训练数据集的函数间隔 $y_i\cdot y(x_i)$

但是这样简单定义的距离存在的问题是：

对于向量 $2\cdot[w,b]$ ，显然也满足方程，这样算出来的投影必然是之前的两倍，这会使得距离函数不具有唯一性。

考虑到 $x=x_0 + w^T \cdot r$ ，其中 $x_0$ 为分割直线上的点，恰好使得法向量 $w$ 方向的投影值为-b：

$w^T\cdot x+b=0$ ，即 $w^T\cdot x= -b$

我们只需要将法向量归一化即可，即有:
$x=x_0 + \frac{w}{||w||} \cdot r$
其中 $r$ 即为投影距离。

将 $x=x_0 + \frac{w^T}{||w||} \cdot r$ 带入原来方程 $y(x)=w^T\cdot x+b\cdot 1$
可得： $y(x)=w^T\cdot x_0 +w^T\cdot \frac{w}{||w||} \cdot r+b\cdot 1$

由于 $w^T\cdot x_0 =-b$ ， $w^T\cdot w =||w||^2$ ,化简为：
$\cdot r$

所以我们可以算出距离函数 $r_i$ :
$r_i=\frac{y(x_i)}{||w||}$
加上之前的符号修正，即有： $r_i=\frac{y_i\cdot y(x_i)}{||w||}$

凸优化训练

我们的目的就是找到使得最近的点 $i$ 到直线具有最大间距:
$\gamma =max_{[w，b]}\{r_i\}$

注意：最近的点会随着法向量方向改变而发生变化，并不是一个固定点

所以对于任意点 $i$ ，我们会有 $r_i ≥ \gamma$ ，即
$\frac{y_i\cdot y(x_i)}{||w||}≥ \gamma$
两边同除 $\gamma$ 得：
在这里插入图片描述
由于我们之前就注意到，对于[w,b]，他们同时扩大相同的倍数，并不会改变分类结果，所以对于缩小 $∣ ∣ w ∣ ∣$ 还是 $||w||\cdot \gamma$ 倍，其实也不会改变分类结果

只是分类结果不改变，但是若作为距离肯定就发生改变了，所以令新的 $w=\frac{w}{||w||\cdot \gamma}$ ， $b=\frac{b}{||w||\cdot \gamma}$
即有：

对于这个新的 $w$ 而言， $\gamma$ 越大，它的长度就越小

对于 $\frac{w}{||w||}$ 而言，其模长为1，所以新的 $w$ 相当于单位向量除以 $\gamma$

所以我们取得最大的 $\gamma$ ，等价于新的 $w$ 模长将最小，即有 $min\{w^2\}$ ，为了便于后面二次函数求导结果好看，我们加了一项，得到：
在这里插入图片描述

这是一个含有不等式约束的凸二次规划问题，可以对其使用拉格朗日乘子法得到其对偶问题：

后续即可推导结果

更多参考文章：
Svm算法原理及实现
 支持向量机（SVM）——原理篇

qq_43133135

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SVM原理入门

支持向量机我们对支持向量机的理解，可以用二维来说明，比如需要找一条最优的直线(超平面)将两类点分开：不过这里需要定义一下说明是最优，那就是：使得离直线较近的点具有最大间距如下有5个蓝色样本，标记为y =1，紫色有5个样本，标记为 y=-1，共10个样本：{(x₁,y₁),(x₂,y₂).........(x10,y10)}\{(x₁ ,y₁) , (x₂,y₂) .........(x_{10},y_{10}) \}{(x₁,y₁),(x₂,y₂).........(x10,y10)} 。
复制链接

扫一扫