第三部分:传统机器学习算法应用
任务
使用 SVM 模型训练分类器。数据集内包含 3 类鸢尾花,分别为山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。每类各 50 个数据,每条记录有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。
要求:
(1)80%数据用于训练,20%数据用于测试。
(2)输出错误项的惩罚系数为 1 时,不同核函数训练得到的模型的测试准确率。
(3)输出核函数固定为高斯核函数时,惩罚系数分别为 0.01,0.1,1,10 时候的测试准确率。
考察对svm分类器参数的认识,熟悉调参过程
from sklearn import svm
from sklearn.datasets import load_iris #引用sklearn内方法加载鸢尾花数据集
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
import numpy as np
from sklearn.preprocessing import scale
data = load_iris()
feature = data.data
target = data.target
# 分割数据集0.8作为训练
x_train, x_test, y_train, y_test = train_test_split(feature, target, random_state=1, train_size=0.8)
# c=1 k