使用SVM对鸢尾花数据进行分类

本文通过鸢尾花数据集演示了如何使用支持向量机(SVM)进行分类。首先,对数据进行预处理,包括Z-score标准化。接着,使用SVM模型进行训练,并计算测试集的准确率。最后,通过可视化展示了SVM决策边界和样本分布。
摘要由CSDN通过智能技术生成

numpy中含逗号的切片:

对于普通的切片:

list名[首:尾:步长]

numpy中的切片:     

数组名[首:尾,首:尾:步长](逗号用于区分维度,注意:逗号前面不能限定步长)

什么意思勒:逗号用于区分维度的意思就是你有多少维,就用多少个逗号,
例如:一个二维数组,[:2,:2]   意思就是切取数组前两行两列的子数组

numpy.std(arr, axis=None, dtype=float64)函数用于计算标准差

arr表示输入的数据,可以是一维数组或二维数组。
axis表示需要计算标准差的轴。
axis=0 表示沿列计算标准差,
axis=1 表示沿行计算标准差
dtype表示计算标准差时使用的数据类型

numpy.mean(a, axis, dtype, out,keepdims )用于计算求平均值:

axis 不设置值,对 m*n 个数求均值,返回一个实数
axis = 0:压缩行,对各列求均值,返回 1* n 矩阵
axis =1 :压缩列,对各行求均值,返回 m *1 矩阵

import numpy as np
from matplotlib import pyplot as plt
from sklearn.svm import SVC
from sklearn.datasets import load_iris

data = load_iris()

X = data['data']#字典存储,用键值做索引
y = data['target']
print(X)
print(y)
# 数据提取(该数据了的种类由0、1、2三个标签,本次只选择0、1这个数据,我也不知道为啥- -,网上大部分都去掉2)
X = X[y != 2, 0:2]
y = y[y != 2]
# Z-score标准化方法:(x-平均数)/标准差
# X=preprocessing.scale(X)
# print(np.mean(X,axis=0))
# 手动实现Z-score标准化
X -= np.mean(X, axis=0)#求取平均值
X /= np.std(X, axis=0, ddof=1)
# print(X)
m = len(X)
# 数据切割8:2
d = int(0.8 * m)
X_train, X_test = np.split(X, [d])
y_train, y_test = np.split(y, [d])
# 创建SVM模型
model_svm = SVC(C=1, kernel='rbf')
# 调用fit函数训练模型
model_svm.fit(X_train, y_train)
# 查看准确率
ss = model_svm.score(X_test, y_test)
print('测试集的准确率是:', ss)
# 调用训练好的模型获得预测的值
X_train_h = model_svm.predict(X_train)
X_test_h = model_svm.predict(X_test)

# 开始画图部分
# 确定画图的范围
x1_min, x1_max, x2_min, x2_max = np.min(X[:, 0]), np.max(X[:, 0]), np.min(X[:, 1]), np.max(X[:, 1])
# 将画布切割成200*200
x1, x2 = np.mgrid[x1_min:x1_max:200j, x2_min:x2_max:200j]
# 计算点到超平面的距离
# 首先对数据进行拼接
x1x2 = np.c_[x1.ravel(), x2.ravel()]
z = model_svm.decision_function(x1x2)
z = z.reshape(x1.shape)
# 画出所有的样本点
plt.scatter(X[:, 0], X[:, 1], c=y, zorder=10)
# 画出测试集的样本点
plt.scatter(X_train[:, 0], X_train[:, 1], s=100, facecolor='none', zorder=10, edgecolors='k')
# 画等值面
# plt.cm中cm全称表示colormap,
# paired表示两个两个相近色彩输出,比如浅蓝、深蓝;浅红、深红;浅绿,深绿这种。
plt.contourf(x1, x2, z >= 0, cmap=plt.cm.Paired)
# 画等值线
plt.contour(x1, x2, z, levels=[-1, 0, 1])
plt.show()








参考:

(1条消息) SVM实现鸢尾花数据集分类_任菜菜学编程的博客-CSDN博客_svm对鸢尾花数据集进行分类【ML】支持向量机(SVM)从入门到放弃再到掌握_半九拾的博客-CSDN博客_svm入门

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值