python学习：使用KNN最邻近分类算法进行iris数据集分析

最新推荐文章于 2022-03-21 15:31:48 发布

须佐麒麟

最新推荐文章于 2022-03-21 15:31:48 发布

阅读量2.7k

点赞数 4

分类专栏：笔记文章标签： python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49539269/article/details/109695337

版权

本文介绍了使用Python中的KNN最邻近分类算法对iris数据集进行分析的过程。首先，概述了KNN算法的工作原理，包括找到最近的k个样本和加权方法。接着，详细讲解了KNeighborsClassifier函数的关键参数。然后，提到了使用train_test_split进行数据划分的重要性，以避免过拟合问题。最后，展示了KNN算法的具体操作步骤，包括数据划分、模型训练、预测及模型评估。

摘要由CSDN通过智能技术生成

概述：

数据集的分析可以简单的分为两步：

1、根据已有的特征数据建立模型。

2、在未来收集到新的特征数据时，可以根据建立的模型来判断新的数据属于哪一类。

而iris数据集包括150朵、三类（setosa、versicolor、virginica）鸢尾花的花萼和花瓣长度宽度的数据。

那么对应上面的两步，我们要做的就是：

1、根据已有的三种鸢尾花花萼和花瓣的长度与宽度数据建立模型。

2、在未来收集到新的鸢尾花数据时，可以根据模型来判断所收集的是哪种类型的鸢尾花 (setosa， versicolor， virginica)。

在这个过程中，我们会用到两个工具：KNN最邻近分类算法和train_test_split。

工具准备：

KNN最邻近分类算法：

作用：判断一个未知类型的数据属于哪一类。

判断步骤：

1、输入样本数据集。

2、输入要判断类型的数据（X）。

3、找出离X最近的k个样本。

4、根据k个样本数据的特征判断x是什么类型。

举例：（数据是我杜撰的，主要是传意用）

1、输入样本数据集→输入若干个苹果和桃子的体积和重量的数据。

2、输入要判断类型的数据（X）→输入未知种类的水果的重量和体积数据（图中五角星）。

3、找出离X最近的k个样本→找到最近的三个样本（这里k=3，最近的三个样本已用线连出）。

最低0.47元/天解锁文章

关注

4
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。