支持向量机原理（一）线性支持向量机

最新推荐文章于 2024-06-11 15:17:35 发布

yhgao96

最新推荐文章于 2024-06-11 15:17:35 发布

阅读量3.7k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/m0_37570854/article/details/90613762

版权

本文介绍了支持向量机（SVM）的基础知识，重点讲解线性SVM。内容包括：1）线性分类器的概念；2）函数间隔与几何间隔的区别；3）支持向量的概念及其在分类中的作用；4）SVM的目标函数与优化过程，涉及拉格朗日对偶问题；5）线性可分SVM的算法步骤。SVM通过最大化几何间隔找到最优超平面，支持向量在决策边界上，对分类确信度至关重要。

摘要由CSDN通过智能技术生成

一、前言

支持向量机（Support Vector Machine）是一种二分类模型，其基本模型定义为特征空间上间隔最大的线性分类器，其学习的策略便是间隔最大化，最终可以转化为一个凸二次规划问题的求解。经过多年的发展，SVM也适用于多元分类，经过拓展，SVM也能够应用于线性回归，本文的重点就是对SVM相关原理进行介绍。

首先什么是线性分类器？给定一些数据点，他们分别属于两个不同的类，现在要找到一个线性分类器把这些数据分成两类。如果用x表示数据点，用y表示类别（比如y可以取1或者-1，分别代表两个不同的类），一个线性分类器的学习目标便是要在n维的数据空间中找到一个超平面（hyper plane），这个超平面的方程可以表示为：

$w^{T}x+b=0$ , $w^{T}$ 表示的转置。

下面举个简单的例子，如下图所示，现在有一个二维平面，平面上有两种不同的数据，分别用圆圈和叉表示。由于这些数据是线性可分的，所以可以用一条直线将这两类数据分开，这条直线就相当于一个超平面，超平面一边的数据所对应的y全是-1，另外一边所对应的y全是1。

图1：线性分类示例

这个超平面可以用分类函数 $f(x)=w^{T}x+b$ 表示，当 f(x) 等于0的时候，x便是位于超平面上的点，而 f(x) 大于0的点对应y=1的数据点， f(x) 小于0时的点对应于y=-1的数据点。

图2：支持向量示例

二、函数间隔与几何间隔

在超平面是 $w^{T}x+b=0$ 确定的情况下， $\left | w^{T}x+b \right |$ 表示点x到距离超平面的远近，而通过观察 $w^{T}x+b$ 的符号与类标记y的符号是否一致可判断是否正确，所以，可以用 $y(w^{T}x+b)$ 的正负性来判定或表示分类的正确性，于是这里便引出来函数间隔的概念，定义函数间隔为：

$\gamma {}'=y(w^{T}x+b)=yf(x)$

但这样定义的函数间隔有问题，即如果成比例的改变w和b（如将它们都变成2w和2b），则函数间隔的值 f(x) 却变成原来的2倍,但是超平面却没有改变，所以只有函数间隔还远远不够。这里便引出来了点到超平面的真正几何距离——几何间隔。

假定对于一个点x，令其垂直投影到超平面上的对应点为 $x_{0}$ ，w是垂直于超平面的一个向量， $\hat{\gamma{}}$ 为样本x到分类面的距离，如下图：

图3：几何距离示例

有 $x=x_{0}+\hat{\gamma{}} \frac{w}{\left \| w \right \|}$ ,其中 $\left \| w \right \|$ 表示的是范数，这里指的是距离。

又由于 x_0 是超平面上的点，满足 $f(x_{0})=0$ ,代入超平面方程 $w^{T}x+b=0$ 即可计算出：

最低0.47元/天解锁文章

yhgao96

关注

1
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
支持向量机原理（一）线性支持向量机

一、前言支持向量机（Support Vector Machine）是一种二分类模型，其基本模型定义为特征空间上间隔最大的线性分类器，其学习的策略便是间隔最大化，最终可以转化为一个凸二次规划问题的求解。经过多年的发展，SVM也适用于多元分类，经过拓展，SVM也能够应用于线性回归，本文的重点就是对SVM相关原理进行介绍。首先什么是线性分类器？给定一些数据点，他们分别属于两个不同...
复制链接

扫一扫

专栏目录