Python数据挖掘实战——KNN算法（K最近邻节点算法，k-NearestNeighbor）

最新推荐文章于 2023-07-21 01:03:46 发布

zhuoyue65

最新推荐文章于 2023-07-21 01:03:46 发布

阅读量3k

点赞数

分类专栏：数据挖掘文章标签： KNN算法 Python 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhuoyue65/article/details/80380667

版权

本文介绍了KNN算法在Python中的应用，详细阐述了分类、监督学习与无监督学习的概念，并通过实例讲解了KNN算法的工作原理、交叉验证方法以及在IRIS数据集上的实战操作，最后展示了如何使用sklearn库进行KNN模型的训练和评估。

摘要由CSDN通过智能技术生成

一、分类

分类是用来预测类别数据的一种方法，可以用来预测未来一段时间内用户是否会流失，预测用户是否会响应你的促销活动，能够评估用户的信用度是好还是差的一系列分类预测问题。

二、概念

2.1监督学习（Supervised Learning）

从给定标注的训练数据集中学习出一个函数，根据这个函数为新数据进行标注。（有因变量y）回归分类、分类、时间序列等。

2.2无监督学习（Unsupervised Learning）

从给定五标注的训练数据中学习出一个函数，根据这个函数为所有数据标注。（聚类、因子、关联等）

2.3分类（Classification）

分类算法通过对已知类别训练数据集的分析，从中发现分类规格，以此预测新数据的类别，分类算法属于监督学习。

三、KNN算法（k-NearestNeighbor）

1.找一个距离，例如最小的圆圈，圈内的训练样本数为3个，其中一个为矩形、两个三角形，待分类的数据从距离上看很可能是三角形。但是把虚线放大，放大到虚线的圆圈，其中有3个蓝色的矩形，2个红色的三角形，

最低0.47元/天解锁文章

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。