机器学习之——K近邻（KNN）算法

Shudsa

于 2023-11-01 20:18:48 发布

阅读量262

点赞数

文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shudsa/article/details/134169315

版权

一、k-近邻算法概述

1、算法介绍

k-近邻算法（K-Nearest Neighbors，简称KNN）是一种用于分类和回归的统计方法。KNN 可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一。

2、算法原理

k-近邻算法基于某种距离度量来找到输入样本在训练集中的k个最近邻居，并且根据这k个邻居的属性来预测输入样本的属性。

比如我们的输入样本是图中的蓝色，那么k个近邻就是距离绿色小圆最近的k个邻居，然后在这k个邻居中，若黑色小圆的数量多于红色小圆，那么输入样本的属性就与蓝黑色小圆相同，反之则与红色小圆的属性相同，这就是k-近邻算法的算法思想。

3、KNN算法中常用的距离指标

在knn算法中怎样计算输入点与其他向量点之间的距离呢？这里就用到了两种距离公式。

欧几里得距离

欧几里得距离是我们在平面几何中最常用的距离计算方法，即两点之间的直线距离。

曼哈顿距离

曼哈顿距离是计算两点在一个网格上的路径距离，与上述的直线距离不同，它只允许沿着网格的水平和垂直方向移动。

4、算法优缺点

优点：

准确度较高：K近邻算法准确度较高为它可以适应不同的数据分布。
适用性广泛：K近邻算法可用于分类和回归问题，同时也支持多分类和多回归问题。
实现简单：K近邻算法的实现非常简单，特别适用于初学者学习模式识别的入门算法

缺点：

计算复杂度高：当数据集很大时，计算距离的时间和空间开销都会很大，影响算法执行效率。
受样本分布影响大：K近邻算法对训练集中样本的密度很敏感，对于密度相差很大的数据集，分类精度会受到较大影响。
数据不平衡问题：当训练集中某些类别的样本数目远远大于其他类别的样本数目时，K近邻算法的准确度会明显下降。

5、算法流程

1、准备数据集：

收集数据集，包括特征与对应的类别标签

对数据进行预处理，例如数据清洗、归一化等。

2、选择k值：

选择一个合适的k值，即确定最近邻居的个数。

3、选择距离度量方法

确定用于比较样本之间相似性的度量方法，常见的如欧几里得距离、曼哈顿距离等。

4、确定最近邻居

选择与待分类样本距离最近的k个训练样本

5、预测

对于分类任务：查看K个最近邻居中最常见的类别，作为预测结果。

对于回归任务：预测结果可以是K个最近邻居的平均值或加权平均值。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习之——K近邻（KNN）算法

KNN是一种基于实例的学习算法，它根据训练样本的特征和对应的类别标签，通过计算测试样本与训练样本之间的距离来进行分类预测。本次实验使我们了解了K近邻算法的基本原理，概念模型以及算法流程，学会了如何使用KNN算法来解决一些简单的分类问题，解决问题：在导入数据源后输出打印资源矩阵与标签矩阵时标签矩阵输出全为0，或者是显示字符串转换为float类型失败，在查找问题后发现是资源文件中数据的储存必须按照float型进行存储，否则资源数据读取有误，无法正常导入，
复制链接

扫一扫

Shudsa CSDN认证博客专家 CSDN认证企业博客

码龄1年

15: 原创

141万+: 周排名

20万+: 总排名

4554: 访问

: 等级

187: 积分

18: 粉丝

37: 获赞

7: 评论

26: 收藏

私信

关注

热门文章

最新评论

机器学习之——支持向量机
CSDN-Ada助手: 首先恭喜您写了第15篇关于机器学习支持向量机的博客，您对这个领域的深入研究和总结让人印象深刻。接下来，我建议您可以考虑在博客中加入一些实际案例或者应用场景，这样可以帮助读者更好地理解支持向量机的实际应用。同时也希望您能继续坚持创作，分享更多有价值的内容，期待您的下一篇博客！
深度学习之——目标检测基础
CSDN-Ada助手: 恭喜你写了第12篇博客！你对深度学习目标检测的基础知识有着很好的理解，文章内容清晰易懂，让我受益匪浅。希望你可以继续保持创作的热情，可以考虑写一些深度学习目标检测的实际应用案例，或者深入探讨一些相关算法的原理，这样可以让读者更加全面地了解这个领域。期待你的下一篇作品！
深度学习之线性回归实现
CSDN-Ada助手: 恭喜您撰写了关于深度学习中线性回归实现的博客，内容详实，让人受益匪浅。希望您能继续分享更多关于深度学习的知识，比如其他常见的模型或者实际应用案例，这样可以让更多人受益。期待您的下一篇作品！
深度学习之——MLP实现
CSDN-Ada助手: 恭喜你在博客上分享了关于深度学习中MLP实现的文章！我非常欣赏你对这个话题的深入探讨和分享。不过在下一篇博客中，我希望你可以进一步深入探讨MLP实现中的一些挑战和解决方案，这样可以为读者提供更多有用的信息。期待你的下一篇精彩文章！
基于hough变换的图像边缘提取
CSDN-Ada助手: 恭喜作者在博客中分享了基于hough变换的图像边缘提取的内容，这是一个非常有趣和实用的技术。希望作者能够继续坚持创作，分享更多关于图像处理和计算机视觉方面的知识。或许下一步可以探讨一些实际案例，展示如何将这些技术运用到实际项目中，让读者更好地理解和应用。期待作者的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。