【机器学习实验一】k近邻算法（KNN)

最新推荐文章于 2024-04-15 22:51:42 发布

疯狂的大马猴—

最新推荐文章于 2024-04-15 22:51:42 发布

阅读量1.5k

点赞数

文章标签： python 机器学习 pycharm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47321558/article/details/120595644

版权

本文介绍了机器学习中的k近邻(KNN)算法，包括算法简介、思想和一般流程。通过电影分类的例子，展示了KNN如何工作。文章还提供了Python代码实现，用于数据导入和KNN算法的执行。总结了KNN算法的优缺点，强调其简单有效性，但也指出计算量大等问题。

摘要由CSDN通过智能技术生成

【机器学习实验一】k近邻算法（KNN)

一、配置环境

看了很多教程，最终决定安装Anaconda+Pycharm的环境。因为Anaconda中包含了很多库，使用的时候就不用另外手动安装了。而Pycharm作为一款针对Python的编辑器，配置简单，功能强大，使用起来省时省心，对初学者友好，这也是编程验室推荐新手使用Pycharm的原因。

基础安装教程大家可参考：Python环境的安装（Anaconda+Jupyter notebook+Pycharm） - 知乎
如果大家决定安装Anaconda+Pycharm的环境，推荐大家参考这个博主的安装教程，会更具体：Python+Anaconda+PyCharm的安装和基本使用【适合完全零基础】不只是教你如何安装，还告诉你为什么这么安装_哔哩哔哩_bilibili

二、KNN算法

1.算法简介

最近邻 (k-Nearest Neighbors， KNN) 算法是一种分类算法， 1968年由 Cover和 Hart 提出，应用场景有字符识别、文本分类、图像识别等领域。

2.算法思想

给定测试样本，基于某种距离度量找出在训练集中与其最靠近的k个“邻居”的信息来进行预测。通常，在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果；在回归任务中可使用“平均法”，即将这k个样本的实值输出标记的平均值作为预测结果；还可基于距离远近进行加权平均或者加权投票，距离越近的样本权重越大。

3. 算法的一般流程

1、收集数据：可以使用任何方法。
2、准备数据：距离计算所需要的数值，最好是结构化的数据格式。
3、分析数据：可以使用任何方法。
4、训练算法：此步骤不适用于 K 近邻算法。
5、测试算法：计算错误率。
6、使用算法：首先需要输入样本数据和结构化的输出结果，然后运行K 近邻算法判定输入数据分别属于哪个分类，最后应用对计算出的分类执行后续的处理。

三、从电影分类了解KNN算法

电影可以按照题材分类，那么如何区分动作片和爱情片呢？

动作片：打斗次数更多
爱情片：

最低0.47元/天解锁文章

疯狂的大马猴—

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【机器学习实验一】k近邻算法（KNN)

【机器学习实验一】k近邻算法（KNN)一、配置环境看了很多教程，最终决定安装Anaconda+Pycharm的环境。因为Anaconda中包含了很多库，使用的时候就不用另外手动安装了。而Pycharm作为一款针对Python的编辑器，配置简单，功能强大，使用起来省时省心，对初学者友好，这也是编程验室推荐新手使用Pycharm的原因。基础安装教程大家可参考：Python环境的安装（Anaconda+Jupyter notebook+Pycharm） - 知乎如果大家决定安装Anaconda+Py
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。