线性可分SVM

最新推荐文章于 2024-06-11 10:43:51 发布

Jeff-Chow000

最新推荐文章于 2024-06-11 10:43:51 发布

阅读量1.6k

点赞数

文章标签：机器学习 1024程序员节

本文链接：https://blog.csdn.net/u014611178/article/details/109166803

版权

支持向量机

文章目录

支持向量机
- 线性SVM

支持向量机(Support Vecor Machine，以下简称SVM)诞生于上个世纪90年代，由于它良好的分类性能，在分类领域称霸多年，在深度时代之前是分类算法中当之无愧的王者。

SVM是一个二分类算法，支持线性分类和非线性分类。经过改进，支持多元分类。经过扩展，也能应用于回归问题。

线性SVM

线性SVM分类算法针对的是线性可分数据集。

线性可分数据集：可以被线性超平面完全正确分类的数据集。

在这里插入图片描述

线性不可分数据集：不可以被线性超平面完全正确分类的数据集。

在这里插入图片描述

问题1：二分类线性可分的训练数据集如何分类？

回答：寻找一个线性分离超平面将样本点分开。

在这里插入图片描述
问题2：当训练数据集线性可分时，有无穷个分离超平面可将两类样本正确分开，应该以什么原则确定最优超平面呢？

在这里插入图片描述
回答：希望分离超平面离两类样本尽可能远，等价于离两类的最近点尽可能远，这称为最大间隔(margin)原则。

在这里插入图片描述

问题3：为什么要离两个类的最近点尽量远?

回答：对未知新样本的分类预测有很好的泛化能力。

在这里插入图片描述

以上的文字表述过于笼统，下面用数学来严谨表达。

线性SVM的优化问题

数据集

假定训练数据集为
$T=\{(\mathbf{x}_1,y_1), (\mathbf{x}_2,y_2), \cdots, (\mathbf{x}_N,y_N)\}$
其中， $\mathbf{x}_i=[x_{i0},x_{i1},\cdots,x_{im}]^T, \quad i=1,2,\cdots,N$ ，是m维特征向量； $y_i \in \{1,-1\}, \quad i=1,2,\cdots,N$ ，是对应特征向量的标签， $y_i=1$ 时 $\mathbf{x}_i$ 为正例， $y_i=-1$ 时 $\mathbf{x}_i$ 为负例。

线性超平面

线性超平面的数学表达式为
$\mathbf{w}^T \mathbf{x}+b=0$
其中， $\mathbf{w}=[w_1,w_2,\cdots,w_m]^T$ 是超参数， $\mathbf{x}$ 是样本特征向量， $b$ 为截距。

分类决策函数

令 $F(\mathbf{x})=\mathbf{w}^T \mathbf{x}+b$ ， $F(\mathbf{x})$ 可以作为二分类的判别器。

假定落入 $F(\mathbf{x}) \gt 0$ 区域为正例，落入 $F(\mathbf{x}) \lt 0$ 区域为负例，可以通过 $F(\mathbf{x})$ 的符号来分类。

上面的想法表示为一个分类决策函数
$f(\mathbf{x})=\text{sgn}(F(\mathbf{x}))=\text{sgn}(\mathbf{w}^T \mathbf{x}+b)$

间隔

在这里插入图片描述
$x_-$ 是 $\mathbf{w}^T \mathbf{x} + b = -1$ 上的一个样本点， $\mathbf{w}^T \mathbf{x} + b = -1$ 以点 $x_-$ 为垂足作一条垂直线，与 $\mathbf{w}^T \mathbf{x} + b = 1$ 相交于 $x_+$ ，设定 $x_+$ 与 $x_-$ 之间的距离为 $\lambda$ ， $x_+$ 与 $x_-$ 的关系可以表示为
$x_+=x_-+\lambda \frac{\mathbf{w}}{||\mathbf{w}||_2}$
其中， $||\mathbf{w}||_2=\sqrt{w_0^2+w_1^2+\cdots+w_n^2}$ ，为 $\mathbf{w}$ 的L2范数。

$\lambda$ 就是要求的间隔，具体的求解方式如下：

$\begin{aligned} &\left\{ \begin{aligned} \mathbf{w}^T \mathbf{x}_+ + b & = 1 \\ \mathbf{w}^T \mathbf{x}_- + b & = -1 \end{aligned} \right. \\ \Rightarrow& \mathbf{w}^T (\mathbf{x}_+ - \mathbf{x}_-)=2 \\ \Rightarrow& \frac{\mathbf{w}^T \lambda \mathbf{w}}{||\mathbf{w}||_2} = 2 \\ \Rightarrow& \lambda = \frac{2}{||\mathbf{w}||_2} \end{aligned}$

这里 $\mathbf{w}^T \mathbf{x}_+ + b = 1$ 和 $\mathbf{w}^T \mathbf{x}_- + b = -1$

最低0.47元/天解锁文章

Jeff-Chow000

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
线性可分SVM

支持向量机支持向量机(Support Vecor Machine，以下简称SVM)诞生于上个世纪90年代，由于它良好的分类性能，在分类领域称霸多年，在深度时代之前是分类算法中当之无愧的王者。SVM是一个二分类算法，支持线性分类和非线性分类。经过改进，支持多元分类。经过扩展，也能应用于回归问题。线性SVM线性SVM分类算法针对的是线性可分数据集。线性可分数据集：可以被线性超平面完全正确分类的数据集。线性不可分数据集：不可以被线性超平面完全正确分类的数据集。问题1：二分类线性可分的训练数据集如
复制链接

扫一扫