机器学习（六）：SVM及相关问题

最新推荐文章于 2020-04-09 16:24:54 发布

芙兰泣露

最新推荐文章于 2020-04-09 16:24:54 发布

阅读量568

点赞数

分类专栏：机器学习与算法文章标签：机器学习 svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012882134/article/details/78210385

版权

本文详细探讨了支持向量机（SVM）的核心概念，包括最大间隔的优化目标，线性可分情况下的决策边界，以及如何通过拉格朗日乘子和二次规划解决约束问题。此外，文章还介绍了非线性可分情况下的软间隔最大化，并触及了核函数在实现非线性SVM中的作用，以帮助读者深入理解SVM的工作原理。

摘要由CSDN通过智能技术生成

笔记迎来了机器学习目前最难的一个知识点。
SVM有几大难点，首先是模型最优化的标准，其次是优化问题的变形，最后则是二次规划的求解。
本文参考了很多篇博客，给出笔者自己的理解，从头推导，最后以一个可以手动计算的实例来讲解SVM求解的全过程。
注意本篇博客的目的在彻底理解，弄清每一步的推导，因此可能对于初识SVM的朋友不那么友好。

最大间隔

首先需要明确的是，svm的形式。
和第二节介绍的逻辑回归相似，svm也有相同的函数表现形式： $y=wx+b$ 。其中w和x都为向量的形式。
但不同的是，两者的优化目标。

逻辑回归追求的是错误率最小

这句话有一层隐含的意思：逻辑回归本身有对于不可分情况的处理能力，即使有些噪音，逻辑回归也可在不改变其自身属性的情况下得到较好的训练模型。
但支持向量机不同，对于svm家族最基本的分类模型——线性可分支持向量机来说，它只能分类完全可分的样本，并在此基础上最大化分类的间隔。
说白了，两者的优化目标不同。
那么支持向量机的优化目标是什么呢？如下：

如上图（摘自数据挖掘导论）,即寻求不同样本间的最大间隔边缘。

方程的形式

接下来，从数据方面做些推导。

样本点为 $(x^i,y^i)$ ，其中 $x^i=(x_1^i,x_2^i,...,x_m^i),y^i\in {-1, 1}$

上面对于svm的数据做了基本的形式约束，即二分类问题。
svm的决策边界可以表达如下：

y = w x + b, x = x i

$y=wx+b,x=x^i$
对于二维数据点来说（即m=2）上述形式就是一条直线。
对于二类线性可分的情况，我们总可以找到两条直线：

b 1 : w x + b = 1 b 2 : w x + b = - 1

$b_1:wx+b=1 \\ b_2:wx+b=-1$
使得当

yi=1时 $y_i=1时$ 对应的有

wxi+b≥1 $wx^i+b\ge 1$ ,当

yi=−1时 $y_i=-1时$ ，有

wxi+b≤−1 $wx^i+b\le -1$ 。
对于于面的理解，建议动手举例理解。
比如两个样本点((1,1),1),((0,0),-1)，这两条直线可以是

(1,1)xi−1=1和(1,1)xi−1=−1 $(1,1)x^i-1=1和(1,1)x^i-1=-1$
以上是svm推到的基础，请务必理解。
有了上述的分类边缘，则两个边缘线间的距离就出来：

d =

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（六）：SVM及相关问题

笔记迎来了机器学习目前最难的一个知识点。 SVM有几大难点，首先是模型最优化的标准，其次是优化问题的变形，最后则是二次规划的求解。本文参考了很多篇博客，给出笔者自己的理解，从头推导，最后以一个可以手动计算的实例来讲解SVM求解的全过程。注意本篇博客的目的在彻底理解，弄清每一步的推导，因此可能对于初识SVM的朋友不那么友好。最大间隔首先需要明确的是，svm的形式。和第二节介绍的逻辑回归相
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。