【入门】使用sklearn实现的KNN算法：鸢尾花数据集分类预测

CodeGuruInk

已于 2024-05-30 07:36:28 修改

阅读量700

点赞数 9

分类专栏：机器学习文章标签：算法 sklearn 分类

于 2024-05-29 20:28:23 首次发布

本文链接：https://blog.csdn.net/aabbbccc6788123/article/details/139304948

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

本文将介绍如何利用K最近邻（KNN）算法对经典的鸢尾花数据集进行分类预测。首先，我们会加载数据集并进行数据的拆分，然后利用KNN算法训练模型。最后，我们将展示模型对测试集的预测结果，并与真实标签进行对比验证，以帮助读者更好地理解KNN算法在分类问题中的应用。

第一步：安装和导入sklean模块

1.命令行安装sklearn

pip install -U scikit-learn

2.导入模块

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

第二步：获取数据

#使用sklearn自带的datasets模块中的load_iris函数加载了鸢尾花（iris）数据集
iris = datasets.load_iris()
#提取出特征数据
iris_X=iris.data
#目标标签
iris_y=iris.target

第二步：分割出训练集和测试集

#会打乱数据
#test_size测试比例，train_test_split把训练数据和测试数据分开
X_train,X_test,y_train,y_test=train_test_split(iris_X,iris_y,test_size=0.3)

第三步：训练模型

#训练模型
knn=KNeighborsClassifier()
knn.fit(X_train,y_train)

第四步：测试结果

#预测值
print(knn.predict(X_test))
# [0 0 1 0 2 2 1 1 0 0 2 1 2 2 2 2 0 0 2 0 2 2 0 0 0 2 0 1 1 0 0 2 0 2 2 0 1
#  1 0 1 1 2 0 1 2]
#真实值
print(y_test)
# [0 0 1 0 2 2 1 1 0 0 2 1 2 2 1 2 0 0 2 0 2 2 0 0 0 2 0 1 1 0 0 2 0 2 2 0 1
#  1 0 1 1 2 0 1 2]

结果大差不差~

总结

通过本文的讲解，我们深入探讨了KNN算法在机器学习中的应用。通过实际操作鸢尾花数据集，我们展示了如何使用KNN算法对数据进行分类预测，并验证了模型的准确性。希望本文能够帮助读者更好地理解KNN算法的原理和实际应用，为进一步学习机器学习算法奠定基础。

CodeGuruInk

关注

9
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【入门】使用sklearn实现的KNN算法：鸢尾花数据集分类预测

本文将介绍如何利用K最近邻（KNN）算法对经典的鸢尾花数据集进行分类预测。首先，我们会加载数据集并进行数据的拆分，然后利用KNN算法训练模型。最后，我们将展示模型对测试集的预测结果，并与真实标签进行对比验证，以帮助读者更好地理解KNN算法在分类问题中的应用。通过本文的讲解，我们深入探讨了KNN算法在机器学习中的应用。通过实际操作鸢尾花数据集，我们展示了如何使用KNN算法对数据进行分类预测，并验证了模型的准确性。希望本文能够帮助读者更好地理解KNN算法的原理和实际应用，为进一步学习机器学习算法奠定基础。
复制链接

扫一扫

专栏目录