svm 解得的w和b分别是什么意思_一文搞懂支持向量机(SVM)算法

本文详细介绍了支持向量机(SVM)的核心概念,包括支持向量、最大间隔超平面和拉格朗日乘子法。通过推导,解释了SVM的目标是找到将数据正确分类且间隔最大的超平面,其中w和b分别代表超平面的法向量和截距。同时,文章讨论了软间隔支持向量机的概念,允许一定的误分类以提高模型的鲁棒性,并介绍了核函数在处理非线性问题中的应用。
摘要由CSDN通过智能技术生成

985afd5389888b117d2c188e870aa5a1.png

SVM中的支持向量是指什么

245db82565cdf0afed7e6660d0001a9d.png

在开始推导之前我们先了解一下支持向量机中的支持向量是指什么。

观察上面一张图,哪些点对于分割线起了决定性作用?

在特别远的区域,不管有多少样本点,对于分割线的位置,也是没有作用的,分割线是图中三个正好落在margin边界上的点决定的。这几个关键点支撑起了一个分割超平面,他们就是SVM中的支持向量。

下面我们开始一步步推导SVM。

SVM的优化目标

现在我们开始讲解SVM算法的优化目标

假设有一堆样本点

equation?tex=%28x_1%2Cy_1%29%2C%28x_2%2Cy_2%29%2C%28x_3%2Cy_3%29...%28x_n%2Cy_n%29 ,在SVM中,二分类问题我们不再用0和1来表示,而是用+1 和 -1 来区分类别(这样会更严格),假设超平面
equation?tex=%28w%2Cb%29 可以将训练样本正确分类,即对于任意样本,如果
equation?tex=y_i+%3D+%2B1 , 则称
equation?tex=x_i 为正例;如果
equation?tex=y_i%3D-1 ,则称
equation?tex=x_i 为负例。 学习的目标是在特征空间中找到一个分离超平面,能够将样本点分到不同的空间。

所以SVM模型的目标函数,就是这样一个超平面,他的公式可以表达为:

equation?tex=w%5Et%5CPhi%28x%29+%2B+b+%3D+0%5C%5C

这里的

equation?tex=%5CPhi%28x%29 是核函数,相当于对x进行了一个维度变换。在这里我们先不去细究这一块,先把
equation?tex=%5CPhi%28x%29 直接看作是
equation?tex=x 本身。

如果能够正确分类所有样本点的超平面存在,我们可以去预测样本点的,而对应的决策函数,也就是用于预测的函数。就是

equation?tex=y%28x%29+%3D+sign%28w%5Et%5CPhi%28x%29+%2B+b%29++%5C%5C

sign函数是符号函数,它的形式是:

equation?tex=sign%28x%29+%3D++%5Cbegin%7Bequation%7D+%5Cleft%5C%7B++++++++++++++%5Cbegin%7Barray%7D%7Blr%7D++++++++++++++-1+%2C+x%3C0++%5C%5C++++++++++++++0%2C+x%3D0%5C%5C++++++++++++++1%2C+x%3E0+%26++++++++++++++++%5Cend%7Barray%7D+%5Cright.+%5Cend%7Bequation%7D+%5C%5C

这里提到的SVM目标函数和决策函数,组合起来就是我们说的SVM算法啦。

根据svm的设定,当样本点分类正确的时候,有:

equation?tex=y%28x_i%29+%3E+0++%2C+y_i+%3D+%2B+1+%5C%5C+

equation?tex=y%28x_i%29+%3C+0++%2C+y_i+%3D+-+1+%5C%5C+

根据上面两个公式可以推出:

equation?tex=y%C2%B7y%28x_i%29+%3E+0

在超平面确认存在的情况下,一般来说,一个点距离分离超平面的远近可以表示分类预测的确信程度。

equation?tex=%7Cw%C2%B7%5CPhi+x%2Bb%7C 能够相对地表示点x距离超平面的远近,而
equation?tex=w%C2%B7%5CPhi%28x%29+%2B+b 的符号与类标记y的符号是否一致代表着分类是否正确(即上面推出来的结论,分类正确时,
equation?tex=y%C2%B7y%28x_i%29+%3E+0 )。所以可以使用
equation?tex=y%28w%C2%B7%5CPhi+x%2Bb%29 来表示分类的正确以及确信度(即样本离分类超平面的距离)。因为这个距离的存在,我们有了函数间隔(margin)的概念。现在我们严肃地把这个定义(其实是李航老师写出来的)写出来,
对于给定的数据集和超平面(用w,b表示),定义超平面(w,b)到样本点
equation?tex=%28x_i%2Cy_i%29 的函数间隔(margin)为:

equation?tex=y%28x_i%29+%3D+y%28w%C2%B7%5CPhi+x_i%2Bb%29+%5C%5C

再次重申下这里的

equation?tex=%5CPhi 是对x做的变换,这里先把它当做x本身就好。

函数间隔可以表示分类预测的正确性和确信度,但是在选择超平面的时候,如果我只是将

equation?tex=w 变为2
equation?tex=w ,其实超平面本身没有改变,而margin却变成了原来的两倍,为了防止这种情况,我们需要对
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值