1、什么是鸢尾花数据集
鸢尾花数据集是Python中自带的一种数据集,也是我们平常实验中常用的分类实验数据集,由Fisher, 1936收集整理。
2、步骤分析
在写机器学习的代码的时候,一定要记得先写主要步骤,然后再细分这些步骤,这样编程思路清晰,在以后的学习复习过程中会很方便
2.1 获取数据集
2.2 数据基本处理
2.3 特征工程
2.4机器学习(模型训练)
2.5模型评估
3、代码实现
导包(我们可以根据下面每一步需要的包去一个个导入)
获取数据集(from sklearn.datasets import load_iris)
iris = load_iris()
数据基本处理(from sklearn.madel_selection import train_test_split)
# x_train,x_test,y_train,y_test分别为训练集特征值、测试集特征值、训练集目标值、测试集目标值
# test_size 为测试集大小(一般为20%~25%)
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2,random_state=20)
特征工程(from sklearn.preprocessing import StandardScaler)