Support Vector Machine（支持向量机）

最新推荐文章于 2023-05-27 11:40:32 发布

@yuqing_wang

最新推荐文章于 2023-05-27 11:40:32 发布

阅读量170

点赞数

分类专栏：统计学习（李航）

本文链接：https://blog.csdn.net/weixin_43199124/article/details/111415490

版权

统计学习（李航）专栏收录该内容

12 篇文章 0 订阅

订阅专栏

线性可分支持向量机

线性可分问题：可以在特征空间中找到一个分离的超平面 $w^Tx+b=0$ 将特征空间划分为正例和负例。通过分类决策函数 $f(x)=sign(w^Tx+b)$ 可以完美划分正负例

函数间隔和几何间隔

函数间隔：
$\hat \gamma_i=y_i(w^Tx_i+b)$

超平面关于训练数据集的函数间隔：
$\hat\gamma=min_i \hat \gamma_i$

comment:
如果将 $w, b$ 同比例变化，则超平面不变，但是函数间隔会发生变化，因此对 $w$ 加约束 $\|w\|=1$ ,此时的函数间隔对应几何间隔

样本点距离：
$\gamma_i=y_i(\frac{w^T}{\|w\|}x_i+\frac{b}{\|w\|})$

超平面关于训练数据集的几何间隔：
$\gamma=min_i \gamma_i$

间隔最大化

对训练数据集找到几何间隔最大的超平面对训练数据集进行分类，要将最难分的正负例分开，几何间隔代表这种分类的确信度
对应优化问题
$_{w,b} \gamma\\ s.t. \ \ y_i(\frac{w^T}{\|w\|}x_i+\frac{b}{\|w\|})\geq\gamma, i=1,\cdots,N$

也可以用函数间隔将上述问题进行改写
$_{w,b} \frac{\hat\gamma}{\|w\|}\\ s.t. \ \ y_i(w^Tx_i+b)\geq\hat\gamma, i=1,\cdots,N$

函数间隔不影响以上问题的求解，因此固定函数间隔 $\hat\gamma=1$
$min_{w,b} \frac{1}{2}\|w\|^2\\ s.t. \ \ y_i(w^Tx_i+b)-1\geq0, i=1,\cdots,N$
以上可以得到一个凸二次规划问题

支持向量
在 $w^TX+B=1 \&-1$ 的点

对偶算法

在这里插入图片描述

对偶问题

在这里插入图片描述

原问题与对偶问题的关系

![在这里插入图片描述](https://img-blog.csdnimg.cn/20201220123205259.png#pic_center

线性支持向量机和软间隔最大化

现实中所有问题不一定都能够完全线性可分
可以引入一个松弛变量 $\xi_i\geq0$
约束条件：
$y_i(w·x_i+b)\geq1-\xi_i$
目标函数：
$\frac{1}{2}\|w\|^2+C\sum_i \xi_i$
软间隔最大化问题：
在这里插入图片描述

在这里插入图片描述

合页损失函数（hinge loss function）

线性支持向量机等价于最小化以下目标函数
$\sum_i [1-y_i(w·x_i+b)_+]+\lambda \|w\|^2$
其中 $x]_+=max(x,0)$
合页损失函数是0-1损失函数的上届，这里合页损失函数只有确信度足够高才是0
在这里插入图片描述

非线性支持向量机和核函数

非线性分类问题

如果能用 $R^n$ 空间内的一个超曲面将正负例分开，那么称这个问题为非线性可分问题
基本想法：
通过一个非线性变换，将输入空间对应以个特征空间，使输入空间中的超曲面模型对应于特征空间中的超平面模型

核函数定义

如果存在一个从 $X\rightarrow H$ 的映射：
$\phi(x):X\rightarrow H$
使得对于所有的 $x,z\in X$ ,函数 $K (x, z)$ 满足条件
$K(X,Z)=\phi(x)·\phi(z)$
则称 $K (x, z)$ 为核函数， $\phi(x)·\phi(z)$ 为 $\phi(x)$ 和 $\phi(z)$ 的内积
注：
（1）特征空间一般是高维的，甚至是无穷维的
（2）以上映射函数不是唯一的

核技巧在支持向量机中的应用

在对偶问题的目标函数，内积 $x_i·x_j$ 可以用核函数来代替 $K(x_i,x_j)$ 代替，此时对偶问题的目标函数为
$W(\alpha)=\frac{1}{2}\sum_i^N\sum_j^N\alpha_i\alpha_jy_iy_jk(x_i,x_j)-\sum_i^N\alpha_i$

同时分类决策函数的内积也用核函数代替
$f(x)=\operatorname{sign}\left(\sum_{i} \alpha_{i}^{*} y_{i} \phi\left(x_{i}\right) \cdot \phi(x)+b^{*}\right)=\operatorname{sign}\left(\sum_{i} \alpha_{i}^{*} y_{i} K\left(x_{i}, x\right)+b^{*}\right)$
因此不需要显式的定义特征空间和映射函数

正定核

正定核充要条件

定理1：
（正定核的充要条件）设 $K：x\times x \rightarrow R$ 为对称函数， $K (X \cdot Z)$ 为正定核函数的充要条件是对于任意的 $x_i \in X(i=1,\cdots ,m),K(x,z)$ 对应的Gram矩阵： $K=[K(x_i,x_j)]_{m\times m}$ 是半正定矩阵

常用核函数

多项式核函数
$k(x·z)=(x·z+1)^p$

高斯核函数
$k(x·z)=exp(-\frac{\|x-z\|^2}{2\sigma^2})$

@yuqing_wang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Support Vector Machine（支持向量机）

线性可分支持向量机线性可分问题：可以在特征空间中找到一个分离的超平面wTx+b=0w^Tx+b=0wTx+b=0将特征空间划分为正例和负例。通过分类决策函数f(x)=sign(wTx+b)f(x)=sign(w^Tx+b)f(x)=sign(wTx+b)可以完美划分正负例函数间隔和几何间隔函数间隔：γ^i=yi(wTxi+b)\hat \gamma_i=y_i(w^Tx_i+b)γ^i=yi(wTxi+b)超平面关于训练数据集的函数间隔：γ^=miniγ^i\hat\gamma=min
复制链接

扫一扫

专栏目录