基于SVM的鸢尾花种类判断(sklearn)

最新推荐文章于 2024-06-01 15:33:20 发布

L@BOY

最新推荐文章于 2024-06-01 15:33:20 发布

阅读量1.6k

点赞数 2

分类专栏：计算机 python python 文章标签： sklearn 支持向量机 python 机器学习人工智能

本文链接：https://blog.csdn.net/weixin_43822656/article/details/124899951

版权

python 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

计算机 python

2 篇文章 0 订阅

订阅专栏

sklearn SVM python 机器学习鸢尾花数据集

一、获取数据集

from sklearn import datasets
iris = datasets.load_iris()

二、查看获取数据集相应字段

主要查看以下字段

iris_data = iris['data']
iris_target = iris['target']
print(iris_data)
print(iris_target)

查看结果展示：
data字段部分展示
在这里插入图片描述
target字段部分展示：

在这里插入图片描述

三、导入模型开始进行模型训练和预测

前期数据准备完成之后，开始进行正餐。

1.引入相应的库文件

代码如下：

from sklearn import svm
import pandas as pd
from sklearn import metrics
from sklearn.model_selection import train_test_split
import scikitplot as skplt

2.读入数据并进行数据集划分

代码如下：

X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_target, test_size=0.25, random_state=0)

此处按照训练集与测试集 3:1进行数据集的划分。

3.创建模型并进行模型训练

代码如下：

clf = svm.SVC(kernel = 'linear',probability = True)
model = clf.fit(X_train, y_train)

关于SVC中具体参数的设置，此处不做过多叙述，如果相对其进行相应参数设置，提高数据分类准确率，可以参考该链接。

4.模型预测与结果展示

代码如下：

y_pred = model.predict(X_test)
y_pred_pro = model.predict_proba(X_test)

print ('ACC: %.4f' % metrics.accuracy_score(y_test,y_pred))
print(metrics.classification_report(y_test,y_pred))
skplt.metrics.plot_roc(y_test, y_pred_pro)
skplt.metrics.plot_precision_recall_curve(y_test, y_pred_pro)
skplt.metrics.plot_confusion_matrix(y_test, y_pred,normalize=True)

结果展示：
在这里插入图片描述

在这里插入图片描述

代码汇总

以下就是全过程，具体环境配置没有细说，配置好相应库，直接粘贴代码即可。
如是对其他数据集进行操作，可直接进行替换即可。

from sklearn import datasets,svm
import pandas as pd
from sklearn import metrics
from sklearn.model_selection import train_test_split
import scikitplot as skplt
iris = datasets.load_iris()
iris_data = iris['data']
iris_target = iris['target']
print(iris_data)
print(iris_target)
X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_target, test_size=0.25, random_state=0)
clf = svm.SVC(kernel = 'linear',probability = True)
model = clf.fit(X_train, y_train)
y_pred = model.predict(X_test)
y_pred_pro = model.predict_proba(X_test)

print ('ACC: %.4f' % metrics.accuracy_score(y_test,y_pred))
print(metrics.classification_report(y_test,y_pred))
skplt.metrics.plot_roc(y_test, y_pred_pro)
skplt.metrics.plot_precision_recall_curve(y_test, y_pred_pro)
skplt.metrics.plot_confusion_matrix(y_test, y_pred,normalize=True)