机器学习方法篇(14)------SVM公式推导

最新推荐文章于 2021-11-30 16:06:54 发布

对半独白

最新推荐文章于 2021-11-30 16:06:54 发布

阅读量989

点赞数

分类专栏：机器学习方法系列文章标签：机器学习 SVM 支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cherrylvlei/article/details/78242377

版权

机器学习方法系列专栏收录该内容

30 篇文章 6 订阅

订阅专栏

● 每周一言

找准自己的定位，才能找到自己的快乐。

导语

前两节讲完了拉格朗日乘子法和KKT条件，而SVM正好符合拉格朗日乘子法定义的不等式约束优化问题形式，本节就基于KKT条件来推导一下SVM。

SVM公式推导

我们先回忆一下前面第11节讲到的SVM模型公式：

fig1

根据上一节讲的KKT条件，将上述SVM的公式条件先转化为小于等于形式，然后带入拉格朗日公式如下：
fig2

fig2

其中(xi，yi)表示第i个样本。由于我们是要求上述拉格朗日公式关于参数w和b的最小值，因此先假定αi为常数，L对w和b求导置0得：
fig3

fig3

将求得的w和b的极值带回拉格朗日公式，可以消掉w和b，剩下的就是一个关于α的式子，公式推导如下：
fig4

fig4

根据拉格朗日对偶问题的定义，到了这一步就应该求W关于α的最大值问题了。这个问题可以这样直观理解，因为KKT条件中h(x)是非正函数，而α ≥ 0，如果W要求的这个极值是最小值，那么无穷大的α会使W的值变得无穷小。因此，我们得到了SVM的“半成品”公式：
fig5

fig5

之所以是“半成品”，是因为到目前为止，我们基于的都是样本完全线性可分的条件。而实际情况往往正负样本之间都会夹杂噪声，即正样本区域包含少量负样本，而负样本区域包含少量正样本。这个时候就需要一个与分界面的容错距离ϵ，将这个ϵ加入到原始的SVM公式我们得到：
fig6

fig6

常数C代表了样本容错距离之和对模型最终准确率的影响程度。将上述公式中新增的部分一起带入拉格朗日公式如下：
fig7

fig7

重新L分别对w、b以及ϵ求导置0得：
fig8

fig8

由于拉格朗日参数ri ≥ 0，所以C ≥ αi ≥ 0。然后将上述极值带回拉格朗日公式，可以消除w、b、ϵ和r，得到W关于α的最终版SVM公式如下：
fig9

fig9

现在的目标就是寻找一组αi的最优解，使得W的值最大。而求最优解的方法叫做 SMO算法，有兴趣的读者可以自行查阅资料学习。

以上便是SVM公式的推导过程，敬请期待下节内容。

本文推导参考：http://blog.csdn.net/on2way/article/details/47729419

结语

感谢各位的耐心阅读，后续文章于每周日奉上，敬请期待。欢迎大家关注小斗公众号 对半独白！

face

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。