K-近邻算法

最新推荐文章于 2024-08-11 22:50:26 发布

chj65

最新推荐文章于 2024-08-11 22:50:26 发布

阅读量120

点赞数

文章标签：近邻

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chj65/article/details/127596007

版权

K-近邻算法学习

根据你的“邻居“来推断你的类别

定义
如果一个样本在特征空间中的K个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别

欧氏距离

在这里插入图片描述

曼哈顿距离

在这里插入图片描述

切比雪夫距离

在这里插入图片描述

闵可夫斯基距离

在这里插入图片描述

标准化欧氏距离

在这里插入图片描述

余弦距离

在这里插入图片描述

汉明距离【Hamming Distance】

在这里插入图片描述

杰卡德距离【Janccard Distance】

在这里插入图片描述

使用sklearn

input: 已知类别数据集中点坐标，预测点坐标
output: 预测点的类别

for i in range(数据集中点的个数):
	计算数据集中点与预测点之间的距离
对距离进行递增排序
选取距离最小的k个点
for j in range(选取的k个点):
	统计这k个点所在类别出现的频率
return 出现频率最高的类别

k值的选择

一般选1，3，5.等，不选偶数值。
k值的减小意味着整体模型变得复杂，容易发生过拟合
k值的增大意味着模型变得简单，容易发生欠拟合
估计误差好才是真的好
近似误差–过拟合–在训练集上表现好，测试集表现不好

kd树

1.构造
树的建立

在这里插入图片描述
2.搜索
最近领域搜索

案例：鸢尾花种类预测

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

chj65 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。