全国高校计算机能力挑战赛--人工智能应用赛样题解析（二）传统机器学习算法应用

最新推荐文章于 2022-12-31 20:11:52 发布

星说starsay

最新推荐文章于 2022-12-31 20:11:52 发布

阅读量850

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/mengsiyuan1997/article/details/113517280

版权

该篇博客介绍了在人工智能应用赛中，如何利用SVM模型进行鸢尾花分类的训练和测试。任务包括使用80%数据训练，20%数据测试，探讨不同核函数和惩罚系数对模型准确率的影响，特别是高斯核函数下，惩罚系数变化对测试准确率的效应，旨在加深对SVM分类器参数理解和调参技巧。

摘要由CSDN通过智能技术生成

第三部分：传统机器学习算法应用

任务

使用 SVM 模型训练分类器。数据集内包含 3 类鸢尾花，分别为山鸢尾（Iris-setosa）、变色鸢尾（Iris-versicolor）和维吉尼亚鸢尾（Iris-virginica）。每类各 50 个数据，每条记录有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度。
要求：
（1）80%数据用于训练，20%数据用于测试。
（2）输出错误项的惩罚系数为 1 时，不同核函数训练得到的模型的测试准确率。
（3）输出核函数固定为高斯核函数时，惩罚系数分别为 0.01，0.1，1，10 时候的测试准确率。

考察对svm分类器参数的认识，熟悉调参过程

from sklearn import svm
from sklearn.datasets import load_iris #引用sklearn内方法加载鸢尾花数据集
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
import numpy as np
from sklearn.preprocessing import scale

data = load_iris()

feature = data.data
target = data.target
# 分割数据集0.8作为训练
x_train, x_test, y_train, y_test = train_test_split(feature, target, random_state=1, train_size=0.8)

# c=1 k