我的python笔记之鸢尾花种类预测实现

最新推荐文章于 2024-04-25 13:38:26 发布

JunQiuPython

最新推荐文章于 2024-04-25 13:38:26 发布

阅读量799

点赞数

文章标签： python

本文链接：https://blog.csdn.net/JunQiuPython/article/details/120061176

版权

本文通过Python实现鸢尾花数据集的分类预测，详细介绍了获取数据、数据处理、特征工程、模型训练及评估的过程，是初学者了解机器学习的好资料。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、什么是鸢尾花数据集

鸢尾花数据集是Python中自带的一种数据集，也是我们平常实验中常用的分类实验数据集，由Fisher, 1936收集整理。

2、步骤分析

在写机器学习的代码的时候，一定要记得先写主要步骤，然后再细分这些步骤，这样编程思路清晰，在以后的学习复习过程中会很方便

2.1 获取数据集

2.2 数据基本处理

2.3 特征工程

2.4机器学习（模型训练）

2.5模型评估

3、代码实现

导包（我们可以根据下面每一步需要的包去一个个导入）

获取数据集（from sklearn.datasets import load_iris）

iris = load_iris()

数据基本处理(from sklearn.madel_selection import train_test_split)

# x_train,x_test,y_train,y_test分别为训练集特征值、测试集特征值、训练集目标值、测试集目标值
# test_size 为测试集大小（一般为20%~25%）
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2,random_state=20)

特征工程(from sklearn.preprocessing import StandardScaler)