支持向量机原理（一）线性支持向量机

最新推荐文章于 2023-12-18 21:01:01 发布

weixin_33795806

最新推荐文章于 2023-12-18 21:01:01 发布

阅读量217

点赞数

原文链接：http://www.cnblogs.com/keye/p/10633530.html

版权

　　SVM压制了神经网络好多年，如果不考虑集成学习算法，不考虑特定的训练集，在分类算法中SVM表现排第一。

　　SVM是一个二元分类算法。

　　SVM学习策略：间隔最大化，可形式化为一个求解凸二次规划问题。

　　间隔最大化使它有别于感知机。

　　SVM包括核技巧，使它成为非线性分类器。

　　支持向量机模型包括：线性可分支持向量机、线性支持向量机、非线性支持向量机。当训练集线性可分，通过硬间隔最大化学习的线性分类器为线性可分支持向量机，又称硬间隔支持向量机；通过软间隔最大化学习的线性分类器为线性支持向量机，又称软间隔支持向量机；当训练及线性不可分，通过核技巧及软间隔最大化学习的称为非线性支持向量机。

1. 回顾感知机模型

　　在感知机原理中，在二维就是找到一条直线，在三维或者更高维就是找到一个超平面，将所有二元类别分开。这个超平面定义为：w^Tx+b=0。如图，在超平面w^Tx+b=0上方定义y=1，在超平面下方定义y=-1。可以看出满足这个超平面的不止一个。我们尝试找到最好的。

　　感知机损失函数优化的思想：让所有误分类点(定义为M)到超平面的距离之和最小，即下面式子的最小化：

　　当w和b扩大N倍，分母L2范数也会扩大N倍。也就是分子，分母有倍数关系。所以可以固定分子或分母为1，然后求分母倒数或另一个分子最小化作为损失函数。感知机模型中，固定分母||w||₂=1，则感知机损失函数简化为：

2. 函数间隔与集合间隔

　　超平面为w^Tx+b=0，|w^Tx+b|为点x到超平面的相对距离。当w^Tx+b与y同号，分类正确，否则，分类不正确。这里引入函数间隔的感念，定义函数间隔 γ^’为：

　　即函数间隔就是感知机模型中误分类点到超平面距离的分子。对于训练集中m个样本点对应的m个函数间隔的最小值，就是整个训练集的函数间隔。

　　函数间隔并不能正常反应点到超平面的距离，在感知机模型中，分子成比例增长，分母也增长。为了统一度量，对法向量w加上约束条件，得到几何间隔γ为：

　　几何间隔是点到超平面的真正距离，感知机模型里用到的距离就是几何距离。

3. 支持向量

　　感知机利用误分类最小的策略，求得分离超平面有无穷多个；线性可分支持向量机利用间隔最大化求得最优分离超平面只有一个。

　　如图，线性可分支持向量机：决策边界(实)，间隔边界(虚)，支持向量(红点)。

　　支持向量到超平面的距离为1/||w||₂，两个支持向量之间的距离为2/||w||₂。

　　

4. SVM模型目标函数与优化

　　SVM模型：让所有点到超平面的距离大于支持向量到超平面的距离。数学表达式：

　　一般取函数间隔r^‘(i)为1，表达式变为：

　　也就是说在约束条件下 y_i(w^Tx_i + 1)≥1 (i = 1,2,3...m)下，最大化1/||w||₂。可以看出，SVM是固定分子优化分母，同时加上支持向量的限制。

　　由于的最大化等同于最小化。所以SVM的优化函数等价于：

　　由于目标函数是凸函数，同时约束条件不等式是仿射的，根据凸优化理论，通过拉格朗日函数将优化目标转化为无约束的优化函数，这和最大熵模型原理中讲的目标函数优化方法一样。优化函数转化为：

　　由于引入拉格朗日乘子，优化目标变为：

　　和最大熵模型一样，这个优化函数满足KKT条件，可以通过拉格朗日对偶将优化问题转化为等价的对偶问题。

　　

转载于:https://www.cnblogs.com/keye/p/10633530.html

weixin_33795806

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
支持向量机原理（一）线性支持向量机

　　SVM压制了神经网络好多年，如果不考虑集成学习算法，不考虑特定的训练集，在分类算法中SVM表现排第一。　　SVM是一个二元分类算法。　　SVM学习策略：间隔最大化，可形式化为一个求解凸二次规划问题。　　间隔最大化使它有别于感知机。　　SVM包括核技巧，使它成为非线性分类器。　　支持向量机模型包括：线性可分支持向量机、线性支持向量机、非线性支持向量机。当训练集线性可分，通过硬...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。