基于SVM、Pipeline、GridSearchCV的鸢尾花分类

最新推荐文章于 2024-04-28 14:32:12 发布

xiaosakun

最新推荐文章于 2024-04-28 14:32:12 发布

阅读量1k

点赞数 2

本文链接：https://blog.csdn.net/xiaosa_kun/article/details/84868406

版权

SVM中文叫做支持向量机，support vector machine的简写，是常用的分类方法。
Pipeline中文叫做管道，是sklearn中用来打包数据预处理、模型训练这2个步骤的常用方法。
GridSearchCV中文叫做交叉验证网格搜索，是sklearn库中用来搜索模型最优参数的常用方法。

2018年8月26日笔记

1.数据集

Iris（鸢尾花）数据集是多重变量分析的数据集。
数据集包含150行数据，分为3类，每类50行数据。
每行数据包括4个属性：Sepal Length（花萼长度）、Sepal Width（花萼宽度）、Petal Length（花瓣长度）、Petal Width（花瓣宽度）。可通过这4个属性预测鸢尾花属于3个种类的哪一类。
样本数据局部截图：

Iris.png

获取150个样本数据的3种方法：
1.完整的样本数据Iris.csv文件下载链接: https://pan.baidu.com/s/16N0ivGWFrmc73ustPLWPZA 密码: ugun
2.数据集链接： https://gist.github.com/curran/a08a1080b88344b0c8a7
3.在sklearn的skleanrn库中自带了iris数据集，可以导入sklearn库的datasets文件，调用datasets文件中的load_iris方法就可以获得iris数据集。
本文采用的是第3种方法，直接从sklearn库中获取数据。

2.观察数据

最低0.47元/天解锁文章

xiaosakun

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
基于SVM、Pipeline、GridSearchCV的鸢尾花分类

SVM中文叫做支持向量机，support vector machine的简写，是常用的分类方法。Pipeline中文叫做管道，是sklearn中用来打包数据预处理、模型训练这2个步骤的常用方法。GridSearchCV中文叫做交叉验证网格搜索，是sklearn库中用来搜索模型最优参数的常用方法。2018年8月26日笔记1.数据集Iris（鸢尾花）...
复制链接

扫一扫