机器学习：支持向量机

最新推荐文章于 2024-07-28 14:43:36 发布

づ红岩乁

最新推荐文章于 2024-07-28 14:43:36 发布

阅读量958

点赞数 23

文章标签：支持向量机机器学习算法

本文链接：https://blog.csdn.net/qq_62087156/article/details/135069055

版权

支持向量机（SVM）基本原理

支持向量机（support vector machines, SVM）是一种二分类模型，其基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；SVM还包括核方法，核方法技巧使它成为实质上的非线性分类器。

SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。

SVM的的学习策略就是间隔最大化，找一个超平面来对样本进行分割，分割的原则是间隔最大化，最终转化为一个凸二次规划问题来求解，得到求解规划的最优化算法。

最大间隔与分类

如上图在二维空间上，两类点被一条直线完全分开叫做线性可分。在样本空间中寻找一个超平面, 将不同类别的样本分开.便得到一个线性模型；

最大化决策边界的边缘:

从二维扩展到多维空间中时，将训练样本分开的超平面可能有很多。为了使得到的超平面更具鲁棒性，泛化能力最强，我们会去找最佳超平面，以最大间隔把两类样本分开的超平面，也称之为最大间隔超平面。

两类样本分别分割在该超平面的两侧；

两侧距离超平面最近的样本点到超平面的距离被最大化了

对偶问题

我们将SVM要求得最大间隔的凸二次规划问题转变成了拉格朗日函数求解问题， 将上述拉格朗日函数转为求其对偶问题，即将 、min、max 求解顺序对调，变为 、max、min 。

原始问题转换

拉格朗日乘子之后的公式为：

优化问题为：

转换问题为m i n − m a x min-maxmin−max问题：

若原始问题和对偶问题都有最优值，则对偶问题最优值d 小于或等于原始问题最优值p

minwF(w,b,ai) 对w、b求偏导，偏导等于零，求极值，得到：

将w、b结果代入到原公式中得到：

核函数

基本想法：不显式地构造核映射 , 而是设计核函数

Mercer 定理 ( 充分非必要 ) ：只要对称函数值所对应的核矩阵半正

定 , 则该函数可作为核函数 . 核函数其实是一种运算技巧而已。

软间隔与正则化

基本思路：最大化间隔的同时 , 让不满足约束的样本应尽可能少

因为 0/1 损失函数非凸、非连续 , 不易优化，故而找到其替代损失函数

支持向量回归

特点: 允许模型输出和实际输出间存在 2 ε 的偏差 .

三种模型

当训练样本线性可分时，通过硬间隔最大化，学习一个线性可分支持向量机

给定线性可分训练数据集，通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面为：给定线性可分训练数据集，通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面为：
在这里插入图片描述
以及相应的分类决策函数为：

称为线性可分支持向量机。

间隔最大化和支持向量

在超平面w ∗ x + b = 0 w*x+b=0w∗x+b=0确定的情况下，∣ w ∗ x + b ∣ |w*x+b|∣w∗x+b∣能够相对的表示点x距离超平面的远近。而w ∗ x + b w*x+bw∗x+b的符号与类标记y的符号是否一致能够表示分类是否正确。所以可用y ( w ∗ x + b ) y(w*x+b)y(w∗x+b)来表示分类的正确性及确信度，这就是函数间隔(functional margin)的概念。

对于给定的训练数据集T和超平面( w , b ) (w,b)(w,b)，定义超平面( w , b ) (w,b)(w,b)关于样本点( x i , y i ) (xi,yi)(xi,yi)的函数间隔为：