机器学习（3）-- KNN算法

最新推荐文章于 2022-06-08 21:36:27 发布

hyl-ocean

最新推荐文章于 2022-06-08 21:36:27 发布

阅读量247

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_38876114/article/details/93593079

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

KNN算法

KNN算法是一种常见的分类算法，其名称来源于 k Nearest neighbors，该算法基本思想为，对于一个分类问题，新的数据的类别应该和离他最近的已知数据点的类别相同。
KNN算法不同于常见的统计算法。是一种懒惰算法。在没有预测行为时，不会做任何计算。
KNN算法的主要工作为遍历已知数据点和选取合适的距离度量方式。因此可以根据度量方式对数据集做预处理加快预测速度。

算法流程

1. 设置数据集和K
2. 设置或者选择距离衡量方式
3. 遍历数据集找到最近K个点
4. 投票决定新的数据集点的类别

关于距离的衡量

Euclidean Distance 定义
在这里插入图片描述

其他的距离计算方式包括余弦值（cos）, 相关度（correlation）, 曼哈顿距离（Manhattan distance）。

算法优缺点

实现简单，但是对于大数据集复杂度很高而且效果往往不好。因为打的数据集对于K的选择更为敏感，不同的K可能导致不同的结果，如下：
当某一个类别的样本过大，可能导致判别失效。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hyl-ocean

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

KNN算法总结

NeilGY的博客

09-17

514

KNN算法整理 ---------------------------------------- -1. 用最相似的样本的目标属性的值来作为当前预测样本的目标属性值 -2. 分类(离散)、回归(连续) 分类：使用相似样本的多数类别作为预测样本的目标属性值回归：将相似样本的y值的均值作为预测样本的目标属性值 -3. a. 从训练数据中找回和预测样本最相似度的...

机器学习系列03——K近邻算法（KNN）

jonsen的专栏

02-08

2861

KNN算法是机器学习中常用的分类算法，该算法思想简单，非常容易入门，本文从KNN的基本思想开始文章书写，接着以一个简单的例子引入KNN算法，中间重点讲解了KNN的三要素（掌握了KNN的三要素基本上就能对KNN算法有一个最基本的把握，面试也能扯一扯），然后对KNN的三要素做了较详细的讲解，最后给出了KNN算法常见的一些应用。

参与评论您还未登录，请先登录后发表或查看评论

算法浅谈：从KNN算法谈起

jdsoivhsoidvhsio的博客

03-24

678

KNN算法经典而且逻辑简单，其背后具有更多的数学与算法处理思想更有价值，学习算法不应该只停留在算法流程上，更要分析它的本质。本文就从KNN开始初步探讨下KNN引出的问题。

KNN近邻算法总结

阿达丶

11-29

697

K-近邻算法 1.什么是K近邻算法 K近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。 2.分类结果的决定因素（1）K为近邻的对象个数，结果影响取决于K的值。（2）测试样本的准确

机器学习基础-k近邻算法(KNN)

qq_24283223的博客

05-07

700

k近邻算法(KNN)定义：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。来源：KNN算法最早是由Cover和Hart提出的一种分类算法思想：相似的样本，特征之间的值应该都是相似的特征处理：需要做标准化处理计算距离公式：两个样本的距离可以通过如下公式计算，又叫欧式距离比如说：a(a1,a2,a3),b(b1,b2,b3) sklearn k-近邻算法API： ...

机器学习-kNN算法

12-15

3. **分类决策**：在找到k个最近邻后，kNN算法会根据这些邻居的类别进行投票，多数票的类别成为新样本的预测类别。对于回归问题，取这k个邻居的平均值或加权平均值作为预测值。 4. **处理异常值**：kNN对异常值非常...

机器学习-KNN算法实现

11-02

在这个"机器学习-KNN算法实现"项目中，你可能使用了PyCharm作为开发环境，这是一个强大的Python IDE，提供了代码编辑、调试、集成测试等众多功能，使得开发过程更为高效。首先，我们需要了解KNN的基本步骤： 1. *...

机器学习实战 - k近邻算法（KNN算法）总结

04-12

机器学习实战 - k近邻算法（KNN算法）总结适合机器学习实战入门新手 K-近邻算法，又称为 KNN 算法，是数据挖掘技术中原理最简单的算法。 KNN 的工作原理：给定一个已知类别标签的数据训练集，输入没有标签的新数据...

华中科技大学计算机学院机器学习课程作业--KNN算法的python实现.zip

08-12

在本作业中，学生将深入理解并实现一种基础的机器学习算法——K近邻（K-Nearest Neighbors，简称KNN）。KNN是监督学习中的非参数方法，广泛应用于分类和回归问题。该作业主要涵盖了以下几个方面：一、KNN算法理论 ...

机器学习报告-基于PCA和KNN算法的毒蘑菇分类预测实验报告-机器学习高分大作业

11-18

3. 使用KNN算法训练模型，寻找最佳K值。 4. 对测试集进行预测，分析模型性能，如准确率、召回率等指标。 5. 结果解释与模型评估，探讨模型的优缺点以及可能的改进方向。五、实验意义该实验的意义在于提供一种可行...

KNN(k-nearest neighbor的缩写)最近邻算法原理详解

春华秋实

08-24

9万+

k-最近邻算法是基于实例的学习方法中最基本的，先介绍基于实例学习的相关概念。基于实例的学习已知一系列的训练样例，很多学习方法为目标函数建立起明确的一般化描述；但与此不同，基于实例的学习方法只是简单地把训练样例存储起来。从这些实例中泛化的工作被推迟到必须分类新的实例时。每当学习器遇到一个新的查询实例，它分析这个新实例与以前存储的实例的关系，并据此把一个目标函数值赋给新实例。基于实例的...

什么是KNN算法？

热门推荐

慧安金科的博客

09-27

12万+

KNN（K-Nearest Neighbor）算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类，也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。 KNN算法的思想非常简单：对于任意n维输入向量，分别对应于特征空间中的一个点，输出为该特征向量所对应的类别标签或预测值。 KNN算法是一种非常特别的机器学习算法，因为它没有一般意义上的学习过程。它的工作原理是利用训练数据...

机器学习--KNN算法基本思想

qq_33531400的博客

10-13

4969

KNN算法--K近邻算法（K-Nearest Neighbors）如下图所示，用肿瘤的大小表示横坐标，时间表示中坐标，其中红色表示良性肿瘤，蓝色表示恶性肿瘤。根据下图能够得到8个点的初始信息。假如此时出现了第9个点，它的落点在第7个点和第8个点之间，怎么判断它的属性是良性还是恶性呢？在KNN的算法中，首先确定K的值，经典的K值为3，在这里K= 3，表示寻找与第9个点最近的三个点。...

机器学习值KNN：K近邻算法（一：算法原理）

梅菜扣肉

07-04

4421

一、KNN概述 KNN是一种常见的有监督学习算法，可以用于分类，也可以用于回归，比较常用于回归。 K近邻算法的直观解释就是给定一个已知样本分类的训练数据集，当有新样本输入时，在训练集中找到K个和新样本距离最近的的训练样本，这K个训练样本多数属于哪个类别，就把这个新样本判定为哪个类别。二、KNN三要素 2.1、距离度量多维特征空间中，两个样本的距离，代表这两个样本的相似程度，距离越近，相似程度就越高，属于同一类别的概率就越大，KNN通常使用的距离度量方法是欧几里得距离，简称欧氏距离。在n...

KNN回归算法【配有案例演示】

lyq7269的博客

09-25

9260

KNN回归算法 KNN回归算法就是给定数据集与结果，预测后面新出的数据集的结果。与前面KNN最邻近算法比较类似，最临近算法是求出预测数据集与训练数据集的每个点之间的距离，取前k个数据集的结果集，把结果集中占比大的结果作为预测结果。但是KNN回归算法，就是将前k个数据集的结果进行求平均作为预测的数据集。图文演示去除Id列和对应的Species列，将其他的4列特征集的前三列作为数据集，后一列作为结果集案例演示写KNN回归算法前的数据准备 # 导入jar包 import numpy as np impo

【机器学习】常用算法系列之——分类算法KNN

技术交流

02-04

1116

背景监督学习中数据是有标签的，比较入门。而在监督学习中，有分类和回归两个任务。其中分类又是比较简单的，那我们从分类入手，介绍第一个基础分类算法——KNN。简介 KNN，全称K-NearestNeighbor，也叫K近邻。是监督学习中的一种基础的常用分类算法。所谓K近邻，即选取k个最近的邻居，来代表每个样本。说起来比较抽象，我们从图上来看一下。已分类数据：图中有两个类别：红色的三角形和...

简单易懂教会你KNN算法

刘耀的博客

09-18

7422

1、什么是KNN算法？KNＮ全称是k-Nearest Neighbors，意思是Ｋ个最近的邻居。ＫNN算法从名字上我们就可以很直观地看出它的原理：从所有的训练样本中找出和未知最近的K个样本，将k个样本中出现最多的类别就是赋给未知样本。举个例子，大家都知道农场里的鹰的故事，鹰从小就在农场里长大，不知道自己是什么种类，如果在它生活的环境里恰好有鸡也有鹰，那么它会认为自己是鹰还是鸡呢？放张图：

KNN算法

Mr_Lowbee的博客

01-19

1万+

文章目录一、问题举例二、算法描述1、最近邻法2、K-近邻法3、解决思路三、结果1、Iris 数据集2、Sonar 数据集3、USPS手写体数据集4、对比算法：Fisher+k近邻四、总结：五、代码一、问题举例用KNN对数据集进行分类 1）USPS 手写体 2）UCI 数据库中 sonar 数据源 3）UCI 数据库中 Iris 数据验证算法：不进行降维 - K 近邻...

KNN算法（一） KNN算法原理

qq_46416934的博客

06-08

767

KNN可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一，注意KNN算法是有监督学习中的分类算法，它看起来和另一个机器学习算法Kmeans有点像（Kmeans是无监督学习算法），但却是有本质区别的。那么什么是KNN算法呢，接下来我们就来介绍介绍吧。KNN的全称是K Nearest Neighbors，意思是K个最近的邻居，从这个名字我们就能看出一些KNN算法的蛛丝马迹了。K个最近邻居，毫无疑问，K的取值肯定是至关重要的。那么最近的邻居又是怎么回事呢？其实啊，KNN的原理就是当预测一个新的值x的时