支持向量机SVM：原理讲解+手写公式推导+疑惑分析

最新推荐文章于 2025-03-22 17:12:06 发布

予亭

最新推荐文章于 2025-03-22 17:12:06 发布

阅读量1.8k

点赞数 3

分类专栏：机器学习文章标签： SVM

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/randompeople/article/details/90020648

版权

本文是需要一定基础才可以看懂的，建议先看看参考博客，一些疑惑会在文中直接提出，大家有额外的疑惑可以直接评论，有问题请直接提出，相互交流。

SVM-统计学习基础

一开始讲解了最小间距超平面：所有样本到平面的距离最小。而距离度量有了函数间隔和几何间隔，函数间隔与法向量 $w$ 和 $b$ 有关， $w$ 变为 $2 w$ 则函数间距变大了，于是提出了几何距离，就是对 $w$ 处理，除以 $∣ ∣ w ∣ ∣$ ，除以向量长度，从而让几何距离不受影响。

但是支持向量机提出了最大间隔分离超平面，这似乎与上面的分析相反，其实这个最大间隔是个什么概念呢？通过公式来分析一下，正常我们假设超平面公式是：
$w^{T}x+b=0 // 超平面$
$\max \limits_{w,b} \quad \gamma \\ s.t. \quad y_i(\frac{w}{||w||}x_i+\frac{b}{||w||}) \ge \gamma$
也就是说对于所有的样本到超平面距离都大于 $\gamma$ ，那这个 $\gamma$ 如何求解，文中约定了概念支持向量：正负样本最近的两个点，这两个点之间的距离就是 $\gamma$ ，那么问题来了，这中间的超平面有无数个，如何确定这个超平面呢？于是我们可以约束这个超平面到两个最近的点的距离是一样的。

上图中两个红色菱形点与一个蓝色实心圆点就是支持向量，通过这个求解目标，以及约束条件来求解这个超平面。书中有完整的公式装换以及证明这个超平面的唯一性。

这里要讲解一个样本点到直线的距离，
正常我们可能难以理解公式里 $y$ 去哪里了，拿二维空间做例子，正常我们说一个线性方程都是 $y = a x + b$ ，其中a和b都是常量，这个线性方程中有两个变量 $x$ 和 $y$ ，转换公式就是 $y - a x - b = 0$ ，从线性矩阵的角度来思考问题就是 $y$ 是 $x_1$ ， $x$ 是 $x_2$ ，用一个 $w^T$ 来表示这两者的系数，用 $b$ 代替 $- b$ ，所以公式就变为了：
$w^{T}x+b=0$
于是任意一个样本点到超平面的距离是：
$\frac{|w^{T}x+b|}{||w||}$
也就是说约束条件中要求 $>\gamma$ ，其实就是大于支持向量到超平面的距离。