SVM支持向量机学习笔记

最新推荐文章于 2024-07-20 21:19:37 发布

维爵爷

最新推荐文章于 2024-07-20 21:19:37 发布

阅读量1.3k

点赞数 2

分类专栏：技术文章标签： svm

技术专栏收录该内容

26 篇文章 0 订阅

订阅专栏

学习SVM，主要阅读了以下两位的博客：

July——支持向量机通俗导论（理解SVM的三层境界）

JerryLead——支持向量机系列

个人感觉，为了真正理解SVM，以上博客至少得认真仔细阅读五遍，当然数学好的话除外。以下是学习SVM的个人笔记，方便以后需要使用时能快速回忆。

SVM原理公式推导笔记

1.线性可分简单推导

支持向量机，因其英文名为support vector machine，故一般简称SVM，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。

分类函数

当f(x) 等于0的时候，x便是位于超平面上的点，而f(x)大于0的点对应 y=1 的数据点，f(x)小于0的点对应y=-1的点，如下图所示：

为了使超平面离数据点的“间隔”越大，我们定义几何间隔，假定对于一个点 x ，令其垂直投影到超平面上的对应点为 x0 ，w 是垂直于超平面的一个向量，为样本x到超平面的距离，如下图所示：

根据平面几何知识，有

等式两边乘上，由于x0满足f(x0)=0即可算出：

通过观察w*x+b的符号与类标记y的符号是否一致可判断分类是否正确，所以，可以用(y*(w*x+b))的正负性来判定或表示分类的正确性。于此，y来表示我们的几何间隔。为了方便推导，我们定义yf(x)=1，最大化几何间隔，得到目标函数是：

通过给每一个约束条件加上一个拉格朗日乘子（Lagrange multiplier），定义拉格朗日函数

接着是

目标函数变成

通过拉格朗日对偶性转化目标函数

由此通过让L(w，b，a) 关于 w 和 b 最小化，然后求对的极大，最后利用SMO算法求解对偶问题中的拉格朗日乘子，从而得到我们的分类函数。以上的理论细节见July的支持向量机导论。

开始我们的对偶问题的求解，固定，要让 L 关于 w 和 b 最小化，我们分别对w，b求偏导数，即令 ∂L/∂w 和 ∂L/∂b 等于零，得到

代入公式中

得到

由此目标函数转化为

这样通过SMO算法，求得拉格朗日乘子，便可得到分类函数中的w和b

从而得到分类函数

2.线性不可分引入核函数

首先是线性不可分的图例，由下图可知，一开始的二维平面上两股数据无法用一根直线分割，而旋转一下到三维平面上，就可以划分开来，这就是在线性不可分的情况下，通过将低维数据映射到高维度上实现可分，但是映射后出现的是高维度的计算复杂度提高，由此引入核函数，即低维度的计算结果可以映射高维度的表现结果。

通过引入高维映射函数后的分类函数：

其中的可以通过求解如下 dual 问题而得到目标函数为：

引入核函数后分类函数为（此形式，w已经用表示）：

其中的可以通过求解如下 dual 问题而得到目标函数为：

3.使用松弛变量处理噪音数据

由于机器学习对数据的依赖性很强，而数据的收集过程中或多或少存在错误数据。

通过改变约束条件

其中称为松弛变量 (slack variable) ，对应数据点允许偏离的 functional margin 的量，得到目标优化函数

又由拉格朗日对偶性等推到的到最终优化目标函数为

接着便是通过SMO算法求出拉格朗日乘子，得到w和b，得到分类函数，从而待分类数据代入分类函数中，实现分类。

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
SVM支持向量机学习笔记

学习SVM，主要阅读了以下两位的博客：July——支持向量机通俗导论（理解SVM的三层境界）JerryLead——支持向量机系列个人感觉，为了真正理解SVM，以上博客至少得认真仔细阅读五遍，当然数学好的话除外。以下是学习SVM的个人笔记，方便以后需要使用时能快速回忆。SVM原理公式推导笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。