周志华《机器学习》西瓜书小白Python学习笔记（七） ———— 第六章支持向量机SVM

最新推荐文章于 2021-04-29 21:03:19 发布

River_J777

最新推荐文章于 2021-04-29 21:03:19 发布

阅读量485

点赞数 1

分类专栏：机器学习文章标签：支持向量机 svm 机器学习算法人工智能

本文链接：https://blog.csdn.net/river_j777/article/details/107367910

版权

本文介绍了支持向量机（SVM）的基本概念，包括SVM的目标是找到最大间隔的线性分类器。通过转换为Lagrange对偶问题，利用拉格朗日乘子法解决凸二次规划问题。核函数的引入解决了非线性可分数据的问题，常见的核函数有线性、多项式、高斯和Sigmoid。此外，文章还讨论了软间隔的概念，允许一定比例的样本分类错误，以提高模型的泛化能力。

摘要由CSDN通过智能技术生成

周志华《机器学习》西瓜书小白Python学习笔记（七） ———— 第六章支持向量机SVM

什么是SVM
SVM求解过程
核函数
软间隔

什么是SVM

支持向量机（support vector machines，SVM）的基本定义为在特征空间上的间隔最大的线性分类器，那么什么是间隔最大的线性分类器呢？
在这里插入图片描述
看这张图，样本空间为 ${(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}$ n个点， $y$ 表示标签取值为-1或1，即图中的黑、白两类点，我们试图找到一个超平面将两类点分隔开，如图，设超平面的表达式为 $\boldsymbol {wx} +b=0$
那么对于黑、白两种点分别有：
$\left\{\begin{aligned}\boldsymbol {wx_i} +b>0 \\ \boldsymbol {wx_i} +b<0 \end{aligned} \right.$
经过 $\boldsymbol w$ 和 $b$ 的放缩可以整理成
$\left\{\begin{aligned} & \boldsymbol {wx_i} +b\geq 1,y_i=1& \\ &\boldsymbol {wx_i} +b\leq-1,y_i=-1& \end{aligned} \right.$
使得两类点中距离这个超平面最近的点有 $\boldsymbol {wx_i} +b=1,-1$ (即图片中标红的的点)，这些点对应的就是支持向量。
根据数学知识，样本空间内任意一个点 $\bf x_i$ 到这个超平面的距离为
$d_i=\frac{|\boldsymbol {wx_i} +b|}{\|\boldsymbol{w}\|}$
研究支持向量对应的点到超平面的距离时，就变成了
$d=\frac1{\|\boldsymbol{w}\|}$
刚才所说的间隔最大的线性分类器中的“间隔”就是指的这个啦！
最优化函数即为
$max\frac1{\|\boldsymbol{w}\|}$
条件是 $w$ 能将两类点分隔开，即 $\boldsymbol {wx_i} +b$ 与 $y_i$ 同号，又因为 $|\boldsymbol {wx_i} +b|\geq1,y=1,-1$ ，所以可以表示为
$y_{i}\left(w x_{i}+b\right) \geq 1, i=1, \ldots, n$
这就是支持向量机的由来。

SVM求解过程

转化为Lagrange对偶问题

回到之前得到的目标函数：
$max\frac1{\|\boldsymbol{w}\|}$
$y_{i}\left(w x_{i}+b\right) \geq 1, i=1, \ldots, n$
可以转化成：
$\frac1{2}{\|\boldsymbol{w}\|}^2$
$y_{i}\left(\boldsymbol{w x}_{i}+b\right) \geq 1, i=1, \ldots, n$
对于这个凸二次规划问题，可以通过拉格朗日对偶性质，将其转化为原问题的对偶问题进行求解。首先根据拉格朗日乘子法得到：
$\mathcal{L}(w, b, \alpha)=\frac{1}{2}\|w\|^{2}-\sum_{i=1}^{n} \alpha_{i}\left(y_{i}\left(w x_{i}+b\right)-1\right)$
其中 $\alpha_i\geq0,i=1,2,...,n$
我们令
$\theta(w)=\max_{\alpha_i\geq0}\mathcal{L}(w, b, \alpha)$
易知，只有当这个超平面将两类样本全部分隔开即所有约束条件都满足，即 $y_{i}\left(w x_{i}+b\right) \geq 1, i=1, \ldots, n$ 时， $\theta(w)=\frac{1}{2}\|w\|^{2}$

最低0.47元/天解锁文章

River_J777

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
周志华《机器学习》西瓜书小白Python学习笔记（七） ———— 第六章支持向量机SVM

周志华《机器学习》西瓜书小白Python学习笔记（七） ———— 第六章支持向量机SVM什么是SVMSVM求解过程转化为Lagrange对偶问题Lagrange对偶问题求解1.min⁡w,bL(w,b,α)\min _{\boldsymbol{w}, b} L(\boldsymbol{w}, b, \boldsymbol{\alpha})minw,bL(w,b,α)2. max⁡αi{min⁡w,bL(w,b,α)}\max_{\alpha_i}\{\min _{\boldsymbol{w},
复制链接

扫一扫