K-近邻算法

K-近邻算法学习

根据你的“邻居“来推断你的类别

  • 定义
    如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别
欧氏距离

在这里插入图片描述

曼哈顿距离

在这里插入图片描述

切比雪夫距离

在这里插入图片描述

闵可夫斯基距离

在这里插入图片描述

标准化欧氏距离

在这里插入图片描述

余弦距离

在这里插入图片描述

汉明距离【Hamming Distance】

在这里插入图片描述

杰卡德距离【Janccard Distance】

在这里插入图片描述

使用sklearn

input: 已知类别数据集中点坐标,预测点坐标
output: 预测点的类别

for i in range(数据集中点的个数):
	计算数据集中点与预测点之间的距离
对距离进行递增排序
选取距离最小的k个点
for j in range(选取的k个点):
	统计这k个点所在类别出现的频率
return 出现频率最高的类别

k值的选择

一般选1,3,5.等,不选偶数值。
k值的减小意味着整体模型变得复杂,容易发生过拟合
k值的增大意味着模型变得简单,容易发生欠拟合
估计误差好才是真的好
近似误差–过拟合–在训练集上表现好,测试集表现不好

kd树

1.构造
树的建立

在这里插入图片描述
2.搜索
最近领域搜索

案例:鸢尾花种类预测
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

chj65

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值