机器学习-19：MachineLN之SVM（1）

最新推荐文章于 2024-08-19 19:55:55 发布

MachineLP

最新推荐文章于 2024-08-19 19:55:55 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习 Deep learning 文章标签：机器学习 svm原理支持向量机详解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014365862/article/details/79184858

版权

机器学习同时被 2 个专栏收录

292 篇文章

订阅专栏

175 篇文章

订阅专栏

你要的答案或许都在这里：小鹏的博客目录

我想说：

其实很多事情，只要你想做，是肯定有方法做的，并且可以做好；

说起SVM很多人都会感觉头疼，无非就是公式多一个，其实很多时候你真是用的话，都不用你手动自己实现，你是在学习的一种机器学习的思维方式，就要比为什么要提出svm？svm解决了什么问题？svm中的kernel又是想解决线性svm解决不了的问题？svm的优势在哪里？就好比生活中不缺乏美，只是缺少发现美的眼睛，在学习中发现问题的能力及其重要，当你问题多了很多人会感觉你烦，但是没关系，解决了就会柳暗花明；并且要时常问自己从中学到了什么？再遇到问题是否可以拿来主义？还是可以从中借鉴？

说起SVM，那么我的问题：（根据MachineLN之三要素：模型、策略、算法）

（1）什么是SVM？（模型）

（2）SVM是如何学习的？（策略）

（3）SVM学习算法？（算法）

顺便后面的要写的展望一下： SVM软间隔最大化；SVM核技巧；SVM求解对偶问题的SMO算法；SVM不用提到的拉格朗日求解，使用梯度下降损失函数应该怎么设计；SVM源码：smo算法求解参数和使用梯度下降求解参数；

看到这里你的答案是什么？下面是我的答案：

（1）什么是SVM？（模型）

在MachineLN之感知机中有提到：感知机的不足和svm的提出；

SVM（支持向量机）表达式：

那么分类超平面：

这里和感知机是一样的，不清楚的可以回过头看一下；不同的是在策略和算法上；

（2）SVM是如何学习的？（策略）

先看这么一句话，开始看可能比较难理解：下面我画个图就好理解了，一般来说，一个点距离分离超平面的远近可以表示分类预测的确信程度，在超平面wx+b=0确定的情况下，|w x+b|能够相对地表示点距离超平面的远近，看下图：

这个理解了，那么提到函数间隔应该就好理解了，在感知机章节我们就注意过wx+b与类标记符号y的问题，他俩是否一致表示分类似否正确，所以可用y(wx+b)表示分类的正确性和确信度，这就是函数间隔；

那么函数间隔 functiona lmargin：对于给定的训练数据集T和超平面(w, b)，定义超平面关于样本点(x_i, y_i)的函数间隔为：

定义超平面(w,b)关于训练数据集T的函数间隔为超平面(w,b)关于T中所有样本点(x_i, y_i)的函数间隔之最小值，即：

但是把手撕那部分除以||w||作为超平面，你会发现，此时w,b成倍的改变，超平面不变，h1和h2也不变，这就引出了几何间隔，也可以直接理解为点到直接的距离。（大家不要怪学术的大牛不点透点，这些都是基础）

接下来几何间隔 geometric margin：对于给定的训练数据集T和超平面(w, b)，定义超平面关于样本点(x_i, y_i)的函数间隔为：

定义超平面(w,b)关于训练数据集T的函数间隔为超平面(w,b)关于T中所有样本点(x_i, y_i)的函数间隔之最小值，即：

那么接下来就可以引出支持向量机的思想：求解能够正确分类训练集并且几何间隔最大的分类超平面，对线性可分的训练数据集而言，线性可分分离超平面有无穷多个(等价于感知机)，但是几何间隔最大的分离超平面是唯一的。这里的间隔最大化又称为硬间隔（有硬就有软）最大化。

定义SVM的策略为：

（1）几何间隔最大化；

（2）并且每个样本点的几何间隔大于设最大函数间隔；

可表示为：

整理后：

你会发现成倍的增加w，b对上式没有影响，那么就可以转化为一个等价问题，将取1；整理后可得：

说到这里了就可以谈一下支持向量的由来：在线性可分情况下，训练数据集的样本点中与分离超平面跄离最近的样本点的实例称为支持向量( support vector )。支持向量是使约束条件式等号成立的点，即

对于二分类yi的取值为:[-1, 1]，那么应该有表达式满足上式：

对这两个就是支持向量H1和H2，看下图：

到这里svm的原理应该大概清楚了；下面就是如何求解参数的问题了。

（3）SVM学习算法？（算法）

转为对偶问题（KKT条件成立）：对于拉格朗日大家应该很熟悉，用来构建函数求解凸优化问题，svm优化问题引入拉格朗日因子后成了：

根据拉格朗日对偶性，原始问题的对偶问题是拉格朗日函数的极大极小问题：

求最值问题我们最擅长的是求导，那么接下来就手撕一下吧：

可总结为：

先聊到这里吧，接下来的内容：SVM软间隔最大化；SVM核技巧；SVM求解对偶问题的SMO算法；SVM不用提到的拉格朗日求解，使用梯度下降损失函数应该怎么设计；SVM源码：smo算法求解参数和使用梯度下降求解参数；更精彩！

推荐阅读：

1. 机器学习-1：MachineLN之三要素

2. 机器学习-2：MachineLN之模型评估

3. 机器学习-3：MachineLN之dl

4. 机器学习-4：DeepLN之CNN解析

5. 机器学习-5：DeepLN之CNN权重更新（笔记）

6. 机器学习-6：DeepLN之CNN源码

7. 机器学习-7：MachineLN之激活函数

8. 机器学习-8：DeepLN之BN

9. 机器学习-9：MachineLN之数据归一化

10. 机器学习-10：MachineLN之样本不均衡

11. 机器学习-11：MachineLN之过拟合

12. 机器学习-12：MachineLN之优化算法

13. 机器学习-13：MachineLN之kNN

14. 机器学习-14：MachineLN之kNN源码

15. 机器学习-15：MachineLN之感知机

16. 机器学习-16：MachineLN之感知机源码

17. 机器学习-17：MachineLN之逻辑回归

18. 机器学习-18：MachineLN之逻辑回归源码

博客等级

码龄11年

457
原创

1159
点赞

3007
收藏

6414
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

机器学习-7：MachineLN之激活函数
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
tf18: 根据姓名判断性别
源头活水2023: 你找到了吗，我也想问网址？
从2D图片生成3D模型（3D-GAN）
有海的地方就是南: 这里是可以下载完整代码的吗
OpenCV之二值图像联通组件寻找
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客介绍了二值图像联通组件寻找，对于学习OpenCV的读者来说是非常有帮助的。我觉得下一篇博客可以继续探讨图像处理方面的技术，比如基于OpenCV的图像分割、图像识别等方面的实践。相信这样的技术文章对其他读者也会非常有帮助，期待更多的分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
用kinect录视频库
張小魚: 换过dll了

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MachineLP 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。