svm 解得的w和b分别是什么意思_一文搞懂支持向量机(SVM)算法

最新推荐文章于 2024-08-15 19:32:28 发布

weixin_39984982

最新推荐文章于 2024-08-15 19:32:28 发布

阅读量6.2k

点赞数 9

文章标签： svm 解得的w和b分别是什么意思

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39984982/article/details/113321735

版权

本文详细介绍了支持向量机（SVM）的核心概念，包括支持向量、最大间隔超平面和拉格朗日乘子法。通过推导，解释了SVM的目标是找到将数据正确分类且间隔最大的超平面，其中w和b分别代表超平面的法向量和截距。同时，文章讨论了软间隔支持向量机的概念，允许一定的误分类以提高模型的鲁棒性，并介绍了核函数在处理非线性问题中的应用。

摘要由CSDN通过智能技术生成

SVM中的支持向量是指什么

在开始推导之前我们先了解一下支持向量机中的支持向量是指什么。

观察上面一张图，哪些点对于分割线起了决定性作用？

在特别远的区域，不管有多少样本点，对于分割线的位置，也是没有作用的，分割线是图中三个正好落在margin边界上的点决定的。这几个关键点支撑起了一个分割超平面，他们就是SVM中的支持向量。

下面我们开始一步步推导SVM。

SVM的优化目标

现在我们开始讲解SVM算法的优化目标

假设有一堆样本点

equation?tex=%28x_1%2Cy_1%29%2C%28x_2%2Cy_2%29%2C%28x_3%2Cy_3%29...%28x_n%2Cy_n%29

,在SVM中，二分类问题我们不再用0和1来表示，而是用+1 和 -1 来区分类别（这样会更严格），假设超平面

equation?tex=%28w%2Cb%29

可以将训练样本正确分类，即对于任意样本，如果

equation?tex=y_i+%3D+%2B1

, 则称

equation?tex=x_i

为正例;如果

equation?tex=y_i%3D-1

,则称

equation?tex=x_i

为负例。学习的目标是在特征空间中找到一个分离超平面，能够将样本点分到不同的空间。

所以SVM模型的目标函数，就是这样一个超平面，他的公式可以表达为：

equation?tex=w%5Et%5CPhi%28x%29+%2B+b+%3D+0%5C%5C

这里的

equation?tex=%5CPhi%28x%29

是核函数，相当于对x进行了一个维度变换。在这里我们先不去细究这一块，先把

equation?tex=%5CPhi%28x%29

直接看作是

equation?tex=x

本身。

如果能够正确分类所有样本点的超平面存在，我们可以去预测样本点的，而对应的决策函数，也就是用于预测的函数。就是

equation?tex=y%28x%29+%3D+sign%28w%5Et%5CPhi%28x%29+%2B+b%29++%5C%5C

sign函数是符号函数，它的形式是：

equation?tex=sign%28x%29+%3D++%5Cbegin%7Bequation%7D+%5Cleft%5C%7B++++++++++++++%5Cbegin%7Barray%7D%7Blr%7D++++++++++++++-1+%2C+x%3C0++%5C%5C++++++++++++++0%2C+x%3D0%5C%5C++++++++++++++1%2C+x%3E0+%26++++++++++++++++%5Cend%7Barray%7D+%5Cright.+%5Cend%7Bequation%7D+%5C%5C

这里提到的SVM目标函数和决策函数，组合起来就是我们说的SVM算法啦。

根据svm的设定，当样本点分类正确的时候，有：

equation?tex=y%28x_i%29+%3E+0++%2C+y_i+%3D+%2B+1+%5C%5C+

equation?tex=y%28x_i%29+%3C+0++%2C+y_i+%3D+-+1+%5C%5C+

根据上面两个公式可以推出：

equation?tex=y%C2%B7y%28x_i%29+%3E+0

在超平面确认存在的情况下，一般来说，一个点距离分离超平面的远近可以表示分类预测的确信程度。

equation?tex=%7Cw%C2%B7%5CPhi+x%2Bb%7C

能够相对地表示点x距离超平面的远近，而

equation?tex=w%C2%B7%5CPhi%28x%29+%2B+b

的符号与类标记y的符号是否一致代表着分类是否正确（即上面推出来的结论，分类正确时，

equation?tex=y%C2%B7y%28x_i%29+%3E+0

）。所以可以使用

equation?tex=y%28w%C2%B7%5CPhi+x%2Bb%29

来表示分类的正确以及确信度（即样本离分类超平面的距离）。因为这个距离的存在，我们有了函数间隔（margin）的概念。现在我们严肃地把这个定义（其实是李航老师写出来的）写出来，

对于给定的数据集和超平面（用w,b表示），定义超平面（w,b）到样本点

equation?tex=%28x_i%2Cy_i%29

的函数间隔(margin)为：

equation?tex=y%28x_i%29+%3D+y%28w%C2%B7%5CPhi+x_i%2Bb%29+%5C%5C

再次重申下这里的

equation?tex=%5CPhi

是对x做的变换，这里先把它当做x本身就好。

函数间隔可以表示分类预测的正确性和确信度，但是在选择超平面的时候，如果我只是将

equation?tex=w

变为2

equation?tex=w

,其实超平面本身没有改变，而margin却变成了原来的两倍，为了防止这种情况，我们需要对

最低0.47元/天解锁文章

weixin_39984982

关注

9
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。