支持向量机（Support Vector Machine，SVM）

AA_WangZai

已于 2022-03-17 15:43:10 修改

阅读量512

点赞数 1

分类专栏： Machine Learning 文章标签：支持向量机机器学习人工智能

于 2022-03-09 17:40:22 首次发布

本文链接：https://blog.csdn.net/qq_43469488/article/details/123378860

版权

Machine Learning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文详细介绍了支持向量机（SVM）在有监督学习中的应用，特别是其如何通过核函数进行非线性分类。SVM利用线性、多项式、径向基（高斯）和Sigmoid等核函数将数据映射到高维空间，找到最佳分类超平面。文章还探讨了SVM的模型原理，包括寻找最大边距超平面的优化问题，并列举了SVM实例化参数如C、kernel等。

摘要由CSDN通过智能技术生成

SVM属于有监督学习模型，主要解决分类问题。

SVM将每个样本数据映射为高维空间中的点，寻找最优区分数据类别的超平面，使各类到超平面的距离最大化。

有监督学习：训练数据既有特征(feature)又有标签(label)，通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。

无监督学习：训练样本的标记信息未知，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础，此类学习任务中研究最多、应用最广的是"聚类" (clustering)。

半监督学习：训练集同时包含有标记样本数据和未标记样本数据，不需要人工干预，让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能，就是半监督学习。

引用：有监督、无监督与半监督学习【总结】 - 文刀煮月 - 博客园 (cnblogs.com)

一、核函数（Kernel Function）

定义：如果低维空间存在 $K(x,y)$ ， $x,y\epsilon X$ (输入空间)，使得 $K(x,y)=\phi (x)\cdot \phi (y)$ ，则称 $K(x,y)$ 为核函数， $\phi (x)\cdot \phi (y)$ 为 $x$ 、 $y$ 映射到特征空间的内积。

需要说明的是，这里只是列出了几种主要的核函数。

1.1 线性核函数

$K(x,y)=x^{^{T}}\cdot y+c$

特征空间和输入空间维度相同，参数较少，适用于特征数量相对于样本数量非常多时。

1.2 多项式核函数

$K(x,y)=(\alpha x^{T}\cdot y+c)^{d}$

正交归一化后的数据可优先选择此核函数。

1.3 径向基核函数（高斯核函数）

$K(x,y)=exp(-\frac{\left \| x-y \right \|^{2}}{2\alpha ^{2}})$

式中， $\alpha ^{^{2}}$ 越大，函数图像越平滑，模型偏差和方差大，泛化能力差，容易过拟合； $\alpha ^{^{2}}$ 越小，函数变化越剧烈，模型偏差和方差越小，对噪声不敏感。

不确定选择何种核函数时，可以此验证。

1.4 Sigmoid核函数

$K(x,y)=tanh(\alpha x^{T}\cdot y+c)$

$c$ 一般取 $\frac{1}{n}$ ， $n$ 是数据维度。SVM使用Sigmoid核函数时，相当于一个两层感知机网络。

二、模型原理分析

两条虚线穿过的边缘点即支持向量。

（就是说咱也不知道为啥不能让图片旋转。。。歪个脑袋将就着看吧）

从上述分析过程可知线性SVM最优化问题的数学描述为：

$max(\frac{1}{2}\left \| \omega \right \|^{2})$

$s.t. \, y_{i}(w^{T}x_{i}+c)\geq 1, i=1,2,3,...,n$ (1)

采用拉格朗日乘子法优化求解极值，则最终优化表达式为：

$min(\sum_{i=1}^{n}\alpha _{i}-\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n})\alpha _{i}\alpha _{j}y_{i}y_{j}x_{i}^{T}x_{j}, 0=\sum_{i=1}^{n}\alpha _{i}y_{i},\alpha _{j}\geq 0$