机器学习算法：kNN和Weighted kNN

最新推荐文章于 2025-03-29 19:33:34 发布

怡研

最新推荐文章于 2025-03-29 19:33:34 发布

阅读量7.2k

点赞数 8

分类专栏：个人笔记文章标签：机器学习

本文链接：https://blog.csdn.net/qq_43416572/article/details/100582970

版权

机器学习算法：kNN和Weighted kNN

一、KNN

kNN全称为k-nearest neighbors，中文名k邻近算法。

k邻近算法理念非常简单：

对于一个测试样本x，在训练样本中寻找k个“距离”x最近的样本，而后在这k个样本中统计数目最多的一个类，那么这一类就是x所在的类。
所以，kNN算法的步骤就出来了：

构建训练集和测试集
设定k的取值
计算测试样本和每个训练样本的距离
将计算出的距离降序排列，选择距离相对较小的k个样本作为测试样本的k个近邻。
找出k个近邻中数目最多的一个类，这个类就是我们想要的结果

ok，kNN介绍完毕。急着吃饭的小伙伴可以回去了，学到这些就足够吹了！我还要继续我的学习。

继续学什么呢？原理就这些原理，那就继续深入学习每一步吧！

（一）训练集和测试集
训练集：
我的理解，训练集是一个集合，集合里面每一个元素分为两部份：

一部分是一个n维向量（也可能是矩阵之类的），也叫特征向量，就是特征空间里面的向量。
另一部分是一个标签，也就是每一类别的代号。

测试集：
测试集是从一堆测试样本中提取出来的特征向量的集合，它和训练集基本一致，一般数量会少于训练集，我们可以在推理阶段将测试集样本输入，把得到的结果与测试集的标签对比，查看模

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

怡研

关注关注

8
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

机器学习(四)：基于KNN算法对鸢尾花类别进行分类预测

阿极的博客

04-16

5424

K最近邻（K-Nearest Neighbor，KNN）算法是一种用于分类和回归的非参数模型，它可以用于模式识别、图像处理、语音识别和推荐系统等领域。 KNN算法的基本思想是根据样本之间的距离和相似性进行分类，即将一个新的样本分类为其最近的K个邻居中最常见的类别。

机器学习3—分类算法之K邻近算法（KNN）

ex_6450的博客

08-01

2851

加载数据集采用loadtxt()函数加载酒类数据集，采用逗号（,）来分割。划分数据集由于Wine数据集第一列为类标，后面13列为13个酒类特征，获取其中两列特征，并将其划分成特征数组和类标数组，调用concatenate()函数实现。KNN训练调用Sklearn机器学习包中KNeighborsClassifier()函数训练，设置K值为3类，并调用clf.fit(train_data,train_target)训练模型，clf.predict(test_data)预测分类结果。...

1 条评论您还未登录，请先登录后发表或查看评论

SE-WKNN（Spearman Enhanced Weighted KNN）融合结构相似性的室内定位算法

最新发布

navsense_support的博客

03-29

575

在众多指纹定位算法中，KNN 和 WKNN 是最常见的，但今天我们来聊一个“升级版”的算法 —— SE-WKNN（Spearman Enhanced WKNN）。

Weighted-KNN-Algorithm-With-Inverse-Distance-Weighting-Method-Python

03-27

加权KNN分类在加权KNN算法中，逆距离加权方法已被用来确定距离点的重要性。根据这种方法，最近邻居的标签比远邻的标签对分类的影响更大。

室内定位算法全解析：从 NN 到 WKNN 及其变体

navsense_support的博客

03-12

1601

在我们的日常生活中，导航和定位已经成为不可或缺的一部分。例如，在商场里寻找某家餐厅，在停车场找到自己的车，或者在医院里快速找到某个科室，这些都依赖于室内定位技术。然而，GPS 在室内通常无法提供高精度的定位，这就需要使用“基于位置指纹（Location Fingerprinting）”的方法来进行室内定位。本文将从最简单的 NN（最近邻）算法开始，逐步讲解 KNN、WKNN 及其不同变体

k-d Tree & BBF & weighted K-NN

shallfun的专栏

06-13

325

k-d Tree Lookup k-d Tree a balanced binary tree Look up the NN a branch-and-bound search 1. depth-first search 2. backtracking search Best Bin First tree结构上的最近bin VS 欧式距离上的最近的bin

KNN算法及KNN的优化算法-加权KNN

sjyttkl的专栏

02-22

1万+

KNN及加权KNN优化算法深度学习的常规套路： 1.收集数据并给定标签 2.训练一个分类器 3.测试，评估 K-近邻(KNN)算法：对于未知类别属性数据集中的点： 1.计算已知类别数据集中的点与当前点的距离 2.按照距离依次排序 3.选取与当前点距离最小的K个点 4.确定前K个点所在类别的出现概率 5.返回前K个点出现频率最高的类别作为当前点预测分类。 KNN算法：不需要使用训...

kNN

weight_water的博客

10-09

411

最近初步学习了kNN算法，同时开始接触python，下面对所查到的一些东西进行记录，以算法为线索，记录语言相关的知识。 kNN 算法是用来分类的算法，通过对对象的特征值进行计算，来给出一个label，而给出label的标准就是靠特征点到标准点的距离，将距离最近的几个点找到，并选出其中出现最多的label，就是特征点的label。其中主要设计以下几个步骤： kNN算法的实现从文件中读取数据...

MATLAB K近邻算法 — knnsearch() 函数

bushixiaofan的专栏

05-30

3万+

K近邻算法是找到K个最近的邻居。 IDX = knnsearch(X,Y) finds the nearest neighbor in X for each point in Y. X is an MX-by-N matrix and Y is an MY-by-N matrix. Rows of X and Y correspond to observations and

机器学习十大算法：kNN.pdf

03-19

* Weighted kNN：在kNN算法中，每个邻居的权重不同，以便更好地反映邻居的重要性。 * Adaptive kNN：根据数据的分布情况，动态地调整k值，以提高算法的性能。 * kNN for Multi-class Classification：kNN算法可以...

机器学习基础：基于样本的学习——KNN

Abner98414的博客

05-24

1795

对监督学习来说：每个样本可以看做是一个包含个特征的元组同时拥有一个表明类别的标签。机器学习的目的：根据数据提供的标签，试图构建一个模型，这个模型可以代表整个数据集的输入和输出关系。instance-based learning：需要将进行标注的 instance 保存在内存中；直接从 instance 中学习（而不建立任何的模型）；也称为 memory-based learning。

KNN文本分类中特征词权重算法的研究

01-26

KNN文本分类中特征词权重算法的研究 机器学习

KNN

天空飘来五个字

11-20

1340

KNN算法（K-NearestNeighbor）https://wenku.baidu.com/view/94aea4e8d15abe23482f4d5b.html https://baike.baidu.com/item/%E9%82%BB%E8%BF%91%E7%AE%97%E6%B3%95/1151153?fr=aladdin&fromid=3479559&fromtitle=knn1.介绍

KNN算法理解

jmydream的专栏

03-06

9万+

一、算法概述 1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平凡的分类器也许是那种死记硬背式的分类器，记住所有的训练数据，对于新的数据则直接和训练数据匹配，如果存在相同属性的训练数据，则直接用它的分类来作为新数据的分类。这种方式有一个明显的缺点，那就是很可能无法找到完全匹配的训练记录。 kNN算法则是从训练集中找

k最邻近算法——加权kNN

weixin_30924087的博客

08-18

2575

加权kNN 　　上篇文章中提到为每个点的距离增加一个权重，使得距离近的点可以得到更大的权重，在此描述如何加权。反函数　　该方法最简单的形式是返回距离的倒数，比如距离d，权重1/d。有时候，完全一样或非常接近的商品权重会很大甚至无穷大。基于这样的原因，在距离求倒数时，在距离上加一个常量：　　weight = 1 / (distance + const) 　　这种方法的潜在问题是，它为...

KNN算法-搜索最优超参数：n_neighbors /weight/p

Genius9_9的专栏

07-15

1万+

在本文中，将选取正确率作为衡量标准，自行实现搜索最优超参数，而非直接调用sklearn中的GridSearchCV。先简单介绍KNN中的三个超参数：超参数为:n_neighbors /weight/p（只有当weight=distance的时候，p值才有意义） n_neighbors：取邻近点的个数k。k取1-9测试 weight：距离的权重；uniform：一致的权重；distanc...

加权 KNN 算法的原理与详解

weixin_49214410的博客

07-03

1785

加权kNN，k近邻算法的增强改进版本。近邻算法（k-Nearest Neighbors, kNN）是一种用于分类和回归的非参数方法。它的基本思想是“看邻居”，即通过查找离目标点最近的 K 个数据点，来判断目标点的类别或数值。举个例子，假设有一个训练集，其中有两类点：红色代表类别0，绿色代表类别1。现在有一个白色点，需要确定它的类别。我们选择k=3，计算白色点到所有红色点和绿色点的距离，选取距离最近的3个点。如果这3个点中有2个是绿色，1个是红色，我们就认为白色点属于绿色那一类，即类别1。。

KNN算法（k近邻算法）原理及总结