机器学习入门（三）：K近邻算法原理 | KNN算法原理

最新推荐文章于 2024-08-09 22:24:25 发布

小言从不摸鱼

最新推荐文章于 2024-08-09 22:24:25 发布

阅读量329

点赞数 16

分类专栏：机器学习入门文章标签：机器学习近邻算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_76820214/article/details/141071652

版权

机器学习入门专栏收录该内容

4 篇文章 0 订阅

订阅专栏

前言

朋友们大家好，来和小言一起踏入机器学习的奇妙世界，先来聊聊一位特别“邻近”的朋友——KNN算法。想象一下，当你在陌生的城市找餐馆，可能会问附近的朋友：“嘿，你们常去哪家吃？”KNN算法就像这样，它找“最邻近”的样本朋友来帮你做决定。简单直接，却能在分类和回归问题上展现不凡力量。今天，就让我们一起揭开KNN算法那神秘智能的面纱！

本篇文章的目标为：

理解KNN 算法原理

1. 为什么学习KNN算法

KNN是监督学习分类算法，主要解决现实生活中分类问题。

根据目标的不同将监督学习任务分为了分类学习及回归预测问题。

监督学习任务的基本流程和架构：

（1）首先准备数据，可以是视频、音频、文本、图片等等

（2）抽取所需要的一些列特征，形成特征向量（Feature Vectors）

（3）将这些特征向量连同标记（Label）一并送入机器学习算法中，训练出一个预测模型（Predictive Model）。

（4）然后，采用同样的特征提取方法作用于新数据，得到用于测试的特征向量。

（5）最后，使用预测模型对这些待测的特征向量进行预测并得到结果（Expected Model）。

上述步骤示意如下：

KNN（K-Nearest Neihbor，KNN）K近邻是机器学习算法中理论最简单，最好理解的算法，是一个非常适合入门的算法，拥有如下特性：

思想极度简单，应用数学知识少(近乎为零)，对于很多不擅长数学的小伙伴十分友好
虽然算法简单，但效果也不错

2. KNN 原理

2.1 案例剖析

上图中每一个数据点代表一个肿瘤病历：

横轴表示肿瘤大小，纵轴表示发现时间
恶性肿瘤用蓝色表示，良性肿瘤用红色表示

疑问：新来了一个病人(下图绿色的点)，如何判断新来的病人(即绿色点)是良性肿瘤还是恶性肿瘤？

解决方法：k-近邻算法的做法如下：

（1）取一个值k=3(k值后面介绍，现在可以理解为算法的使用者根据经验取的最优值

(2）在所有的点中找到距离绿色点最近的三个点

（3）让最近的点所属的类别进行投票

（4）最近的三个点都是蓝色的，所以该病人对应的应该也是蓝色，即恶性肿瘤。

总结：

K-近邻算法可以用来解决监督学习中的分类问题。

算法的思想：通过K个最近的已知分类的样本来判断未知样本的类别。

2.2 算法原理

KNN算法描述

输入：训练数据集

，xi为实例的特征向量，yi={C1，c2...Ck}为实例类别。

输出：实例x所属的类别y

步骤：

（1）选择参数K

（2）计算未知实例与所有已知实例的距离（多种方式计算距离）

（3）选择最近K个已知实例

（4）根据少数服从多数的原则进行投票，让未知实例归类为K个最近邻中最多数的类别。

总结：KNN算法没有明显的特征训练过程，它的训练阶段仅仅将样本保存起来，训练开销为0，等到收到测试样本后在进行处理（如K值取值和距离计算）。因此，对应于训练阶段的学习该算法是一种懒惰学习（lazy learning）。

KNN三要素：

距离度量
K值选择
分类决策准则

3. 小结

让我们静下心来回忆一下本篇文章的内容：

1. KNN 算法原理简单，不需要训练，属于监督学习算法，常用来解决分类问题

2. KNN原理：先确定K值，再计算距离，最后挑选K个最近的邻居进行投票

希望本篇文章对您有所帮助，感谢支持！

小言从不摸鱼

关注

16
点赞
踩
18

收藏

觉得还不错? 一键收藏
5
评论
机器学习入门（三）：K近邻算法原理 | KNN算法原理

K-近邻算法可以用来解决监督学习中的分类问题。算法的思想：通过K个最近的已知分类的样本来判断未知样本的类别。
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。