机器学习
xueyifeiyun1989zx,公众号:围着围巾的小黑机器学习之监督学习实战
前文我们提到机器学习中的监督学习,其中有一个模型是我们提到的但是没有训练测试的,叫做支持向量机(简称SVM)。支持向量机也是监督学习里面一个非常容易理解的模型。概念和公式定义我们就不带大家看了,我们还是从代码实战的角度来学习。
SVM本质原理是利用超平面将数据分割成可分的部分,对于可分的数据集来说不用做维度转换,那么对于不可分的数据集要想利用SVM怎么办呢,是有办法的,就是核函数。核函数的存在的意义就是将低维不可分的数据转化成高维可分的数据,从而实现对数据的分类。本文主要关注不同SVM中的核函数,因为我们主要是应用为主,所以只会提高各种核函数并做相关的代码实践,不会对各种核函数的原理进行分析。
另外还有一个问题是需要在本文解决的,大家如果前文仔细看的话,会发现在整个训练和预测的过程中,我们生成了两个数据集,操作起来有点麻烦,那么是否有现成的方法可以自动帮我们将数据集切分成训练集和测试集呢,答案显然是肯定的。
1、导入依赖包、生成基础数据集
from sklearn.datasets import make_classificationimport matplotlib.pyplot as pltfrom sklearn import preprocessingfrom sklearn.model_selection import train