R机器学习：分类算法之K最邻进算法（KNN）的原理与实现

最新推荐文章于 2025-04-14 09:00:00 发布

公众号Codewar原创作者

最新推荐文章于 2025-04-14 09:00:00 发布

阅读量3.2k

点赞数 5

分类专栏： R

本文链接：https://blog.csdn.net/tm_ggplot2/article/details/116034397

版权

从今天开始给大家写机器学习算法，这个东西并不是大多数人想象的那么高深，也不是说编程的人，搞计算机的人才能学习使用，医学领域、社会科学领域的研究越来越多运用机器学习的，在我的理解中每个人都应该掌握基本的机器学习思想和基本的编程能力。

这个系列的第一篇文章从简单的分类算法KNN开始：这个算法真的非常的简单，简单到初中生都可以掌握，所以大家一定要有信心：

kNN is arguably the simplest machine learning algorithm. In spite of its simplicity, kNN can provide surprisingly good classification performance, and its simplicity makes it easy to interpret.

KNN算法思想解释

K最近邻算法是一种分类算法，算法思想是在数据集中找到与样本最相似的K个样本，如果这K个样本中的大多数属于某一类别，则该样本也属于某一类别。

用例子说明：现在有3个爬行动物，其中两个是毒蛇分别叫做：grass snake and the adder，一个是虫子叫做slow worm。这个虫子和蛇长得挺像，很多人都会把它们搞混。

现在你参与了一个项目：去调查一片草地上到底这三种动物到底有多少个，在实地调查的时候你只能通过动物的身长Body length和攻击性aggression这两个指标来对其的类型做出判断，你和一个动物专家已经收集了一些动物数据（已经有带标签的数据集了），现在你自己想训练一个KNN模型对动物进行自动分类。

你收集的数据可视化如下图：