【机器学习】SVM iris数据集实现2

最新推荐文章于 2024-10-10 15:26:43 发布

YZXnuaa

最新推荐文章于 2024-10-10 15:26:43 发布

阅读量3.6k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/YZXnuaa/article/details/79543729

版权

本文介绍了如何使用Scikit-Learn库中的SVM进行机器学习，特别是针对Iris数据集。首先展示了如何加载数据，接着讲解如何划分训练集和测试集，然后训练SVM分类器，比较不同核函数的影响，并计算分类器的准确率。最后，通过绘制图像来直观展示分类结果。

摘要由CSDN通过智能技术生成

一、导入sklearn算法包

　　Scikit-Learn库已经实现了所有基本机器学习的算法，具体使用详见官方文档说明：http://scikit-learn.org/stable/auto_examples/index.html#support-vector-machines。

　　skleran中集成了许多算法，其导入包的方式如下所示，

　　逻辑回归：from sklearn.linear_model import LogisticRegression

朴素贝叶斯：from sklearn.naive_bayes import GaussianNB

　　K-近邻：from sklearn.neighbors import KNeighborsClassifier

　　决策树：from sklearn.tree import DecisionTreeClassifier

　　支持向量机：from sklearn import svm

二、sklearn中svc的使用

（1）使用numpy中的loadtxt读入数据文件

　　loadtxt()的使用方法：

　　fname:文件路径。eg：C:/Dataset/iris.txt。

　　dtype：数据类型。eg：float、str等。

　　delimiter：分隔符。eg：‘，’。

　　converters：将数据列与转换函数进行映射的字典。eg：{1:fun}，含义是将第2列对应转换函数进行转换。

　　usecols：选取数据的列。

　　以Iris兰花数据集为例子：

　　由于从UCI数据库中下载的Iris原始数据集的样子是这样的，前四列为特征列，第五列为类别列，分别有三种类别Iris-setosa， Iris-versicolor， Iris-virginica。　　　

　　当使用numpy中的loadtxt函数导入该数据集时，假设数据类型dtype为浮点型，但是很明显第五列的数据类型并不是浮点型。

　　因此我们要额外做一个工作，即通过loadtxt()函数中的converters参数将第五列通过转换函数映射成浮点类型的数据。

　　首先，我们要写出一个转换函数：

 
         def 
         iris_type(s): 
        
         it  
         = 
         {
           
         'Iris-setosa' 
         :  
         0 
         ,  
         'Iris-versicolor' 
         :  
         1 
         ,

最低0.47元/天解锁文章

YZXnuaa

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录