机器学习04：支持向量机

Cherries Man

已于 2023-01-16 13:37:37 修改

阅读量263

点赞数 2

分类专栏：机器学习文章标签：人工智能

于 2022-07-07 18:37:23 首次发布

本文链接：https://blog.csdn.net/myf_666/article/details/124720654

版权

机器学习专栏收录该内容

20 篇文章 12 订阅

订阅专栏

本文介绍了支持向量机（SVM）的基础知识，包括线性和非线性支持向量机的概念。线性SVM通过寻找最大间隔的超平面进行分类，对于线性可分数据效果良好。非线性SVM则通过映射到高维空间解决线性不可分问题。文章探讨了SVM的优化问题，并指出在实际应用中如何处理非线性数据。

摘要由CSDN通过智能技术生成

作者：非妃是公主
专栏：《机器学习》
个性签：顺境不惰，逆境不馁，以心制境，万事可成。——曾国藩

专栏地址

《机器学习》专栏地址

专栏系列文章

机器学习01：绪论

机器学习02：模型评估

机器学习03：线性回归与多分类学习

机器学习04：支持向量机

机器学习05：神经网络学习

机器学习06：决策树学习

机器学习07：贝叶斯学习

机器学习08：最近邻学习

机器学习09：无监督学习

机器学习10：集成学习

机器学习11：代价敏感学习

机器学习12：演化学习

文章目录

专栏地址
专栏系列文章
线性支持向量机
非线性支持向量机

线性支持向量机

支持向量机(Support Vector Machine, SVM)不仅具有坚实的统计学理论基础，还可以很好地应用于高维数据、避免维度灾难问题，已经成为一种倍受关注的机器学习分类技术。
在这里插入图片描述

直观上看应该去找位于两类训练样本"正中间"的划分超平面，即B1，因为该划分超平面对训练样本局部扰动的"容忍押性最好，由于训练集的局限性或噪声的因素，训练集外的样本可能比图中的训练样本更接近两个类的分隔界，这将使许多划分超平面出现错误，而红色的超平面受影响最小.换言之，这个划分超平面所产生的分类结果是最鲁棒的，对未见示例的泛化能力最强.

在这里插入图片描述
假设决策边界能将训练样本正确分类，即对于任意样本点 $x_i,y_i)$ ：若有 $y_i=+1$ ，则有 $\omega^\mathrm{T}x_i+b>0$ ；若 $y_i=-1$ ，则有 $\omega^\mathrm{T}x_i+b<0$ 。那么通过调整决策边界的参数 $\omega$ 和 $b$
总可以得到：

$\begin{cases} \omega^\mathrm{T}x_i+b>0& y_i=+1\\ \omega^\mathrm{T}x_i+b<0& y_i=-1 \end{cases}$

推导如下：主要就是以下两张图所含内容（参考链接：【数之道】支持向量机SVM是什么，八分钟直觉理解其本质）

在这里插入图片描述

求解最大间隔对应的 $w 和 b$ ：

转化为优化问题：

由于目标函数是二次的，并且约束条件在参数 $\omega$ 和 $b$ 上是线性的，因此线性支持向量机的学习问题是一个凸二次优化问题，可以直接用现成的优化计算包求解，或者用更高效的拉格朗日乘子法求解。
线性SVM假定训练样本是线性可分的，即存在一个线性的决策边界能将所有的训练样本正确分类。

非线性支持向量机

然而在实际应用中，在原始的样本空间内也许并不存在这样的决策边界。
对于这样的问题，可将样本从原始空间映射到一个更高维的特征空间，使得样本在映射后的特征空间内线性可分。
例如在下图中，如果将原始的二维空间映射到一个合适的三维空间，就能找到一个合适的划分超平面。幸运的是，如果原始空间是有限维，即属性数目有限，那么一定存在一个更高维的特征空间使得样本线性可分。
在这里插入图片描述