基于python的分类预测_机器学习算法（五）: 基于支持向量机的分类预测

最新推荐文章于 2024-05-24 23:05:56 发布

weixin_39843782

最新推荐文章于 2024-05-24 23:05:56 发布

阅读量690

点赞数

文章标签：基于python的分类预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39843782/article/details/113712892

版权

声明：本次撰写以Datawhale团队提供的学习材料以自学为主，代码为Datawhale团队提供，利用阿里云天池实验室与编辑器pycharm完成测试。

支持向量机(Support Vector Machine，SVM)是一个非常优雅的算法，具有非常完善的数学理论，常用于数据分类，也可以用于数据的回归预测中，由于其优美的理论保证和利用核函数对于线性不可分问题的处理技巧，在上世纪90年代左右，SVM曾红极一时。本文将不涉及非常严格和复杂的理论知识，力求于通过直觉来感受 SVM。

Demo实践Step1:库函数导入 Step2:构建数据集并进行模型训练 Step3:模型参数查看 Step4:模型预测 Step5:模型可视化学习目标

*了解支持向量机的分类标准;

*了解支持向量机的软间隔分类;

*了解支持向量机的非线性核函数分类;

可以对照之前的逻辑回归模型的决策边界，我们可以发现两个决策边界是有一定差异的(可以对比两者在X,Y轴上的截距)，这说明这两个不同在相同数据集上找到的判别线是不同的，而这不同的原因其实是由于两者选择的最优目标是不一致的。接下来我们进行SVM的一些简单介绍。支持向量机的介绍

我们常常会碰到这样的一个问题，首先给你一些分属于两个类别的数据

现在需要一个线性分类器，将这些数据分开来。

我们可能会有多种分法：

那么现在有一个问题，两个分类器，哪一个更好呢？

为了判断好坏，我们需要引入一个准则：好的分类器不仅仅是能够很好的分开已有的数据集，还能对未知数据集进行两个的划分。

假设，现在有一个属于红色数据点的新数据(3， 2.8)

可以看到，此时黑色的线会把这个新的数据集分错，而蓝色的线不会。

我们刚刚举的例子可能会带有一些主观性。

那么如何客观的评判两条线的健壮性呢？

此时，我们需要引入一个非常重要的概念：最大间隔。

最大间隔刻画着当前分类器与数据集的边界，以这两个分类器为例：

可以看到，蓝色的线最大间隔是大于黑色的线的。

所以我们会选择蓝色的线作为我们的分类器。

最低0.47元/天解锁文章

weixin_39843782

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于python的分类预测_机器学习算法（五）: 基于支持向量机的分类预测

声明：本次撰写以Datawhale团队提供的学习材料以自学为主，代码为Datawhale团队提供，利用阿里云天池实验室与编辑器pycharm完成测试。支持向量机(Support Vector Machine，SVM)是一个非常优雅的算法，具有非常完善的数学理论，常用于数据分类，也可以用于数据的回归预测中，由于其优美的理论保证和利用核函数对于线性不可分问题的处理技巧，在上世纪90年代左右，SVM曾...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。