机器学习基础（一）：支持向量机原理

最新推荐文章于 2024-07-03 00:26:07 发布

博途慧算

最新推荐文章于 2024-07-03 00:26:07 发布

阅读量1.5k

点赞数 4

分类专栏：机器学习 # 机器学习基础文章标签：机器学习支持向量机算法

本文链接：https://blog.csdn.net/lygeneral/article/details/104199088

版权

概览

一、前言
二、基础
- 1.概念
- 2.函数间隔与几何间隔
三、硬间隔最大化
四、软间隔最大化
- 1.间隔最大化
- 2.合页损失函数
五、总结

一、前言

支持向量机（Support Vectore Machine，SVM）学习问题可以表示为凸优化问题，能够在小样本训练量的情况下，使用有效地算法求解线性及非线性问题的全局最优解。支持向量机在求解非线性分类问题时，利用核技巧将非线性问题从低维空间向高维空间映射，然后采取线性分类问题的方式去解决。在非线性问题上的优异表现及较高的鲁棒性，使得支持向量机成功应用于语音识别、人脸识别、图像处理等领域。

二、基础

1.概念

支持向量机以间隔最大化为目标，采取硬间隔最大化（Hard margin）与软间隔最大化（Soft margin）的模型，寻找一个超平面对样本进行分割。支持向量机三个核心要点为间隔、对偶、核技巧。
1）训练样本线性可分时，采用硬间隔最大化训练线性可分支持向量机；
2）训练样本近似线性可分时，采用软间隔最大化训练线性支持向量机；
3）训练样本非线性时，基于核技巧，采用硬间隔最大化或软间隔最大化训练非线性支持向量机。

在样本空间中，划分超平面可通过如下线性方程来描述：
$\omega^\tau x_i+b=0$

其中 $w$ 为法向量，决定了超平面的方向， $b$ 为位移量，决定了超平面与原点的距离。

假设超平面能将训练样本正确地分类，即对于训练样本 $(x i, y i)$ ，满足以下公式：
$\left\{\begin{array}{l}\omega^\tau x_i+b>0,y_i=+1\\\omega^\tau x_i+b<0,y_i=-1\end{array}\right.$
其中， $y_i=+1$ 表示样本为正样本， $y_i=-1$ 表示样本为负样本。

2.函数间隔与几何间隔

由超平面的公式可得知超平面 $(\omega,b)$ 关于样本 $x_i,y_i)$ 的函数间隔为：
${\widehat\gamma}_i=y_i\left(\omega^\tau x_i+b\right)$

如果成比例地改变 $\omega$ 和 $b$ ，超平面没有改变，函数间隔却有所变化。函数间隔可以表示分类预测的正确性及确信度，但是不足以选择分离超平面，因此引出超平面 $(\omega,b)$ 关于样本 $x_i,y_i)$ 的几何间隔，即样本点至超平面的距离：
${\gamma}_i=y_i\left(\frac{\omega^\tau}{\left\|\omega\right\|}x_i+\frac b{\left\|\omega\right\|}\right)$

即使超平面参数 $\omega$ 和 $b$ 成比例地改变，几何间隔也不会变化。

三、硬间隔最大化

1.间隔最大化

下面考虑如何求得一个几何间隔最大的分离超平面，即最大间隔分离超平面。该问题可以表示为下面的约束最优化问题：
$\left\{\begin{array}{l}\underset{\omega,b}{max}\;\;\;\gamma\\s.t.\;\;\;\;y_i\left(\frac{\omega^\tau}{\left\|\omega\right\|}x_i+\frac b{\left\|\omega\right\|}\right)\geq\gamma,\;\;\;\;\;i=1,2,...,N\end{array}\right.$

该优化问题可改写为：
$\left\{\begin{array}{l}\underset{\omega,b}{max}\;\;\;{\textstyle\frac{\widehat\gamma}{\left\|\omega\right\|}}\\s.t.\;\;\;\;y_i\left(\omega^\tau x_i+b\right)\geq\gamma,\;\;\;\;\;i=1,2,...,N\end{array}\right.$

最低0.47元/天解锁文章

博途慧算

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础（一）：支持向量机原理

概览一、前言二、SVM概念1.概念2.函数间隔与几何间隔总结一、前言支持向量机（Support Vectore Machine, SVM）学习问题可以表示为凸优化问题，能够在小样本训练量的情况下，使用有效地算法求解线性及非线性问题的全局最优解。支持向量机在求解非线性分类问题时，利用核技巧将非线性问题从低纬空间向高纬空间映射，然后采取线性分类问题的方式去解决。在非线性问题上的优异表现及较高的鲁棒...
复制链接

扫一扫

专栏目录