机器学习笔记

最新推荐文章于 2024-09-24 11:20:26 发布

__BOX

最新推荐文章于 2024-09-24 11:20:26 发布

阅读量232

点赞数

分类专栏：机器学习分类算法文章标签： KNN python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/richard_pl/article/details/80454506

版权

机器学习同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

机器学习笔记之KNN算法实现

算法原理
算法特点
算法实现

原理讲解

kNN又称为k-近邻算法。是一种简单高效的分类算法。

主要原理

存在一个样本数据集合，也称作训练样本集。并且样本集中每个数据都存在标签，即我么知道样本集中每个数据的真实分类。该算法的一个典型特点就是不用生成一个分类模型。一个输入的训练数据即是一个模型。
之后，输入测试数据。对于每个测试数据来说，他的分类结果是不明确的。需要通过算法来判别。这里KNN采用的方法是通过计算输入元组和训练数据中的所有元组的距离（对于数值型属性可以采用欧式距离，编码型可以参考采用汉明距离），然后取距离最小的k个元组（一般来说k是人工输入的一个值，一般来说k取小于20的值比较合适）。判断这k个元组中占比最多的那个类别，然后将这个类别标签作为输入元组类别的一个预测值。

算法特点

优点：精度高，对于异常值不敏感，无数据输入假定
缺点：计算复杂度高，这是由于算法本身特点决定的，每做一次判断都需要遍历计算遍训练集时间复杂度 $O(n^2)$ 。空间复杂度也相对比较高
适用数据范围：数值型和标称型

算法实现

实现过程这里主要是用python进行实现的，进行测试的时候采用的是42000条记录的测试集和42000条记录的训练集合。整个运行过程相对比较长。具体实现过程参考GitHub:https://github.com/PL97/KNN
如有任何错误欢迎指正

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

__BOX CSDN认证博客专家 CSDN认证企业博客

码龄7年

27: 原创

19万+: 周排名

103万+: 总排名

8万+: 访问

: 等级

926: 积分

12: 粉丝

19: 获赞

26: 评论

119: 收藏

私信

关注

热门文章

分类专栏

linux 1篇
java学习笔记 4篇
数据库 1篇
分类算法 2篇
错误 7篇
matlab
机器学习 2篇
opencv
tensorflow 2篇
数据清洗 1篇
pwn 4篇
安装 1篇
c++
记录 2篇

最新评论

Pytorch 错误记录： BrokenPipeError: [Errno 32] Broken pipe
CSDN-Ada助手: 非常感谢你分享关于Pytorch错误记录的博客，对于这个问题我也遇到过。我觉得下一篇博客可以继续深入探讨Pytorch的错误处理和调试技巧，这样的技术文章对其他用户也会非常有帮助。相信你的经验和技巧分享会吸引更多读者的关注和学习。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
匈牙利算法的matlab实现
黄稚女: matlab是列优先
JAVA Scanner 用法注意事项（scanner 使用错误：Exception in thread "main" java.util.NoSuchElementExceptionation ）
失之东隅lk: 我就是这样子，不知道咋回事
匈牙利算法的matlab实现
想吃鱼2: 给的程序似乎有误，第一个测试结果 2，3， 1，4，5，最代价只要32，而提供程序3，1，2，4，5代价是46
匈牙利算法的matlab实现
圆妮: 第二个矩阵，怎么我算的结果是1,3,4,2呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。