支持向量机1—线性可分支持向量机与硬间隔最大化

最新推荐文章于 2022-01-07 18:15:56 发布

wxn704414736

最新推荐文章于 2022-01-07 18:15:56 发布

阅读量1.5k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/wxn704414736/article/details/80729825

版权

机器学习专栏收录该内容

23 篇文章 1 订阅

订阅专栏

支持向量机（support vector machine, SVM）是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；支持向量还包括核技巧，这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化，可形式化为一个求解凸二次规划（convex quadratic programming）的问题，也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法时求解凸二次规划的最优化算法。

凸规划

设S为n维欧式空间Rn（R的n次方）中的一个集合，若对S中任意两点，连接它们的线段中任一点仍属于S，那么就说S为一个凸集。

对于S中的任意两点x1,x2，对于任意的λ∈[0,1], 都有λx1+(1−λ)x2∈S，称S为一个凸集。

x1,x2 为凸集中的任意两点，λ∈[0,1]，若满足 f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)，则称函数为凸函数。线性函数是凸函数也是凹函数。

若最优化问题的目标函数为凸函数，不等式约束函数也为凸函数，等式约束函数是仿射的，则称该最优化问题为凸规划。凸规划的可行域为凸集，因而凸规划的局部最优解就是它的全局最优解。当凸规划的目标函数为严格凸函数时，若存在最优解，则这个最优解一定是唯一的最优解。

KKT条件

对于含有不等式约束的优化问题，如何求取最优值呢？常用的方法是KKT条件，同样地，把所有的不等式约束、等式约束和目标函数全部写为一个式子L(a, b, x)= f(x) + a*g(x)+b*h(x) (a≥0,b≥0)，KKT条件是说最优值必须满足以下条件：(1) g(x)≤0; (2) a≥0; (3) a*g(x)=0;

综述

支持向量机学习方法包含构建由简至繁的模型：线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器，即线性可分支持向量机，又称为硬间隔支持向量机；当训练数据近似线性可分时，通过软间隔最大化，学习一个线性的分类器，即线性支持向量机，又称软间隔支持向量机；当训练数据线性不可分时，可通过使用核技巧及软间隔最大化，学习非线性支持向量机。

当输入空间为欧氏空间或离散集合，特征空间为希尔伯特空间时，核函数表示将输入从输入空间映射到特征空间得到的特征向量之间的内积，通过使用核函数可以学习非线性支持向量机，等价于隐式地在高维的特征空间中学习线性支持向量机。这样的方法称为核技巧。核方法是比支持向量机更为一般的机器学习方法。

线性可分支持向量与硬间隔最大化

1、线性可分支持向量机

对一个二类分类问题，假设输入空间与特征空间为两个不同的空间。输入空间为欧氏空间或离散集合，特征空间为欧氏空间或希尔伯特空间。线性可分支持向量机、线性支持向量机假设这两个空间的元素意义对应，并将输入空间中的输入映射为特征空间中的特征向量。非线性支持向量机利用一个从输入空间到特征空间的非线性映射将输入映射为特征向量。所以输入都由输入空间转换到特征空间，支持向量机的学习是在特征空间进行的。

假设给定一个特征空间上的训练数据集T={（x1,y1），（x2,y2），...，（xN,yN）}，其中xi∈χ=Rn，yi∈γ={-1,+1}。学习的目标是在特征空间中找到一个分离超平面，能将实例分到不同类。分离超平面对应于方程 w*x+b=0，由法向量w和截距b决定。线性可分支持向量机利用间隔最大化求最优分离超平面，这时解是唯一的。

给定线性可分训练数据集，通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面以及相应的分类决策函数如下。