KNN分类实战-----对鸢尾花数据进行分类(sklearn)

最新推荐文章于 2025-04-15 22:00:43 发布

Nicht_Sehen

最新推荐文章于 2025-04-15 22:00:43 发布

阅读量3.4k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/Nicht_sehen/article/details/89189513

版权

本文通过KNN算法对鸢尾花数据集进行分类，详细介绍了查看数据、训练模型、预测类别和评估模型的过程。在评估环节，模型在测试集上的准确度达到97.4%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

KNN算法介绍详见：https://blog.csdn.net/Nicht_sehen/article/details/80495884
原理详见：维基百科
题外话：维基百科真的是个好东西（：D）

查看数据

首先我们来看一下数据集：

import pandas as pd
import mglearn
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

iris_dataset = load_iris()
#  随机划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris_dataset['data'],iris_dataset['target'], random_state=0)
# 将训练集转化为dataframe 使用pandas画图
iris_dataframe = pd.DataFrame(X_train, columns = iris_dataset.feature_names)
g = pd.plotting.scatter_matrix(iris_dataframe, c = y_train,figsize = (15,15),marker = 'o',hist_kwds = {
   'bins':20},s=