支持向量机

最新推荐文章于 2024-07-08 17:32:03 发布

Echo00x0

最新推荐文章于 2024-07-08 17:32:03 发布

阅读量1.6k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_20602929/article/details/51051117

版权

支持向量机（SVM）是一种分类模型，通过最大化间隔来找到最佳超平面。在解决线性可分问题时，SVM采用硬间隔最大化，而在面对非线性问题时，它使用核技巧和软间隔最大化。SVM的优化问题可转换为求解凸二次规划，其对偶问题通过拉格朗日乘子和核函数简化。常见的核函数有多项式和高斯核。此外，序列最小优化（SMO）算法被用来高效地求解大规模SVM问题。

摘要由CSDN通过智能技术生成

线性可分支持向量机
线性支持向量机与软间隔最大化
非线性支持向量机与核函数
序列最小优化算法

支持向量机（SVM）是一种二类分类模型。基本模型是定义在特征空间上的间隔最大的线性分隔器，间隔最大使它有别于感知机——误分类点到超平面S的总距离最小。

核技巧使它成为实质上的非线性分类器。间隔最大化可形式化为一个求解的凸二次规划，也等价于正则化的合页损失函数的最小化问题——求解凸二次规划的最优化算法

线性可分支持向量机

分离超平面为: $w^*\cdot x+b^*=0$
分类决策函数： $f(x)=sign(w^*\cdot x+b^*=0)$

函数间隔与几何间隔

在超平面 $w\cdot x+b=0$ 确定的情况下，l $w\cdot x+b$ l能够表示点x距离超平面的远近.而 $w\cdot x+b$ 与符号与类标记y的符号是否一致能够表示分类是否正确。所以可用 $y(w\cdot x+b)$ 来表示分类的正确性及确信度—等价于l $w\cdot x+b$ l
这就是函数间隔,定义：
$\gamma_{i}=y_{i}(w\cdot x_{i}+b)$

i=1,….,N

$\gamma=min \gamma_{i}$

若对分离超平面的法向量w加某些约束，如规范化， $\|w\|=1$ ，使得间隔是确定的，此时函数间隔为几何间隔

几何间隔定义
$\gamma_{i}=y_{i}(\dfrac{w}{\|w\|}\cdot x_{i}+\dfrac{b}{\|w\|})$
i=1,….,N

$\gamma=min \gamma_{i}$

(硬)间隔最大化

对线性可分的训练数据集而言，线性可分分离超平面有无穷多个（等价于感知机），但是几何间隔最大的分离超平面是唯一的.这里的间隔最大化又称为硬间隔最大化（与将讨论的训练数据集近似线性可分的软间隔最大化相对应）

最大间隔分离超平面，表示为下面的约束最优化问题
$max_{\,w,b}\,\,\,\,\,\,\gamma$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,y_{i}(\dfrac{w}{\|w\|}\cdot x_{i}+\dfrac{b}{\|w\|})>=\gamma,\,\,\,\,\,\,i=1,2,....,N$
可改写为
$max_{\,w,b}\,\,\,\,\,\,\dfrac{\gamma}{\|w\|}$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,y_{i}(w\cdot x_{i}+b)>=\gamma,\,\,\,\,\,\,i=1,2,....,N$

然而函数间隔γ并不影响最优化问题的解（因为有 $\|w\|$ 的存在），令γ=1最后改写为
$min_{\,w,b}\,\,\,\,\,\,\dfrac{\|w\|^2}{2}$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,y_{i}(w\cdot x_{i}+b)-1>=0,\,\,\,\,\,\,i=1,2,....,N$

算法（线性可分支持向量机学习算法——最大间隔法）

1） $min_{\,w,b}\,\,\,\,\,\,\dfrac{\|w\|^2}{2}$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,y_{i}(w\cdot x_{i}+b)-1>=0,\,\,\,\,\,\,i=1,2,....,N$

2）利用拉格朗日算法整合函数求偏导等于0，得到参数即可

最大间隔分离超平面的存在且唯一

支持向量和间隔边界

支持向量是使约束条件式等号成立的点，即

$y_{i}(w\cdot x_{i}+b)-1=0$

这里写图片描述

对 $y_{i}=+1$ 的正例点，支持向量在超平面: $H_{1}:w\cdot x_{i}+b=1$
对 $y_{i}=-1$ 的负例点，支持向量在超平面: $H_{1}:w\cdot x_{i}+b=-1$

间隔边界即： $\dfrac{2}{\|w\|}$

给个例子,二维情况

这里写图片描述

学习的对偶算法

应用拉格朗日对偶性，通过求解对偶问题得到原始问题的最优解
因为：一是对偶问题往往更易求解；二是引进核函数，今儿推广非线性分类问题

引进拉格朗日乘子αi>=0，i=1,2,…,N，定义拉格朗日函数:
$L(w,b,\alpha)=\dfrac{\|w\|^2}{2}-\sum_{i=1}^N\alpha_{i}y_{i}(w\cdot x_{i}+b)+\sum_{i=1}^N\alpha_{i}$
$\alpha=(\alpha_{1},\alpha_{2},...,\alpha_{N})^T$ 为拉格朗日乘子向量
根据拉格朗日对偶性，原始问题的对偶问题是极大极小问题：
max(对α)min(对w,b)L(w,b,α)

得到下面与之等价的对偶最优化问题：
$min_{\,\alpha}\,\,\,\,\,\,\dfrac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})-\sum_{i=1}^N{\alpha_{i}}$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,\sum_{i}^N\alpha_{i}y_{i}=0$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\alpha_{i}>=0,\,\,\,\,\,\,i=1,2,....,N$

定理，设 $\alpha^*=(\alpha_{1}^*,\alpha_{2}^*,...,\alpha_{l}^*)^T$ 是对偶最优化问题—上述等价问题的解，则存在下标 j，使得 $\alpha_{j}^*>0$ ，并按下式求得原始最优化问题的解 $w^*,b^*$ :

$w^*=\sum_{i=1}^N\alpha_{i}^* y_{i}x_{i}$
$b^*=y_{j}-\sum_{i=1}^N\alpha_{i}^*y_{i}(x_{i}\cdot x_{j})$

算法（线性可分支持向量机学习算法）

1）构造并求解约束最优化问题
$min_{\,\alpha}\,\,\,\,\,\,\dfrac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})-\sum_{i=1}^N{\alpha_{i}}$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,$ s.t. $\,\,\,\,\,\,\sum_{i}^N\alpha_{i}y_{i}=0$
$\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\alpha_{i}>=0,\,\,\,\,\,\,i=1,2,....,N$
求得最优解 $\alpha^*=(\alpha_{1}^*,\alpha_{2}^*,...,\alpha_{N}^*)^T$ .

2）计算
$w^*=\sum_{i=1}^N\alpha_{i}^* y_{i}x_{i}$
并选择 $\alpha^*$ 的一个正分量 $\alpha_{j}^*$ >0计算
b

最低0.47元/天解锁文章

Echo00x0

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
支持向量机

线性可分支持向量机函数间隔与几何间隔硬间隔最大化算法线性可分支持向量机学习算法最大间隔法支持向量和间隔边界学习的对偶算法算法线性可分支持向量机学习算法对于支持向量的定义线性支持向量机与软间隔最大化线性支持向量机下面给出支持向量机定义相应的学习对偶算法算法线性支持向量机学习算法支持向量图示化理解合页损失函数非线性支持向量机与核函数核技巧正定核常用的核函数非线
复制链接

扫一扫

专栏目录