机器学习实战(1):K邻近算法

根据《机器学习实战》一书来实现KNN算法:

一、确定K邻近算法

在这里插入图片描述在这里插入图片描述
不过这个方法没有用kd树进行存储,搜索效率较低。

二、例1:使用KNN算法改进配对效果

2.1 准备数据

先来看看原始数据:
在这里插入图片描述
这是一个文本文件,每一行都是字符串,需要对其进行分割,然后分别构造数据矩阵和标注向量。
在这里插入图片描述

2.2 数据预处理

由于我们得到的数据都是正数,所以可以采用归一化进行标准化:
x ∗ = x − min ⁡ max ⁡ − min ⁡ x^* = \frac{x - \min}{\max - \min} x=maxminxmin
在这里插入图片描述

2.3 验证分类器准确率

在这里插入图片描述

三、小结

k近邻算法的优点在于简单有效,主要是发现样本之间蕴含的关系。它的缺点是必须保存全部的数据集,需要大量的存储空间,此外也会非常耗时。
K近邻算法的另一个缺点是它不能给出数据的基础结构信息,相对地,决策树可以解决这个问题,而且决策树还能节省存储空间和计算时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值