机器学习实战（1）：K邻近算法

最新推荐文章于 2020-10-14 21:41:49 发布

白噪声序列

最新推荐文章于 2020-10-14 21:41:49 发布

阅读量212

点赞数

分类专栏： Python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43565540/article/details/107799935

版权

Python 同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

8 篇文章 1 订阅

订阅专栏

根据《机器学习实战》一书来实现KNN算法：

一、确定K邻近算法

在这里插入图片描述
不过这个方法没有用kd树进行存储，搜索效率较低。

二、例1：使用KNN算法改进配对效果

2.1 准备数据

先来看看原始数据：
在这里插入图片描述
这是一个文本文件，每一行都是字符串，需要对其进行分割，然后分别构造数据矩阵和标注向量。

2.2 数据预处理

由于我们得到的数据都是正数，所以可以采用归一化进行标准化：
$x^* = \frac{x - \min}{\max - \min}$
在这里插入图片描述

2.3 验证分类器准确率

在这里插入图片描述

三、小结

k近邻算法的优点在于简单有效，主要是发现样本之间蕴含的关系。它的缺点是必须保存全部的数据集，需要大量的存储空间，此外也会非常耗时。
K近邻算法的另一个缺点是它不能给出数据的基础结构信息，相对地，决策树可以解决这个问题，而且决策树还能节省存储空间和计算时间。

白噪声序列

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。