机器学习——支持向量机

最新推荐文章于 2024-08-27 22:32:28 发布

酱香编程，风雨兼程

最新推荐文章于 2024-08-27 22:32:28 发布

阅读量613

点赞数 8

分类专栏：机器学习文章标签：支持向量机机器学习算法

本文链接：https://blog.csdn.net/2301_79815102/article/details/139060740

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、间隔与支持向量

给定训练样本集 $D=\{ (\bm x_1,y_1),(\bm x_2,y_2),\cdots,(\bm x_m,y_m)\},y_i \in \{ -1,+1\}$ ，分类学习最基本的想法就是基于训练集 $D$ 在样本空间中找到一个划分超平面，将不同类别的样本分开。
如图所示，可能存在的划分超平面的样本有很多，直观上看，应该去找位于两类训练样本“正中间”的划分超平面。这个划分超平面所产生的分类结果是最鲁棒的，对未见示例的泛化性能最强。
在这里插入图片描述
在样本空间中，划分超平面可以通过如下线性方程来描述：
$\bm W^T \bm x+b=0$
其中， $\bm w=(w_1;w_2;\cdots;w_d)$ 为法向量，决定了超平面的方向， $b$ 为位移项，决定了超平面与原点之间的距离。样本空间中任意点 $\bm x$ 到超平面 $(\bm w,x)$ 的距离可以表示为
$r=\frac {|\bm w^T+b|} {|| \bm w||}$
假设超平面 $(\bm w,b)$ 能将训练样本正确分类，即对于 $(\bm w,b) \in D$ ，若 $y_i=+1$ ，则有 $\bm {w^Tx_i}+b>0$ ;若 $y_i=-1$ ，则有 $\bm {w^Tx_i}+b<0$ .令
$\begin {cases} \bm {w^Tx_i}+b \ge +1,y_i=+1;\\ \bm {w^Tx_i}+b \le -1,y_i=-1 \end {cases}$
距离超平面最近的这几个训练样本点使上式的等号成立，它们被称为“支持向量”，两个异类支持向量到超平面的距离之和为
$\gamma =\frac 2 {|| \bm w||}$

$\gamma$ 被称为“间隔”

支持向量与间隔
如要找到具有“最大间隔”的划分超平面，也就是要找到能满足上式中约束的参数 $\bm w和b$ ，使得 $\gamma$ 最大。
$\begin{cases} max_{\bm w,b}\frac 2 {||\bm w||} \\ s.t. y_i(\bm w^T \bm x_i+b) \ge1,i=1,2,\cdots,m. \end{cases}$
由上式可知，为了最大化间隔，仅需最大化 $||\bm w||^{-1}$ ，等价于最小化 $||\bm w||^2$ ，则上式可以重新写为
$\begin{cases} min_{\bm w,b}\frac 1 2 {||\bm w||^2} \\ s.t. y_i(\bm w^T \bm x_i+b) \ge1,i=1,2,\cdots,m. \end{cases}$
　这就是支持向量机SVM的基本型