【冰糖R语言】class 库实现 KNN 分类模型问题讨论

冰糖不在家

已于 2022-12-04 16:39:41 修改

阅读量548

点赞数

分类专栏： R 文章标签： r语言

于 2021-04-29 22:12:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoxiao_ziteng/article/details/116262525

版权

R 专栏收录该内容

23 篇文章 9 订阅

订阅专栏

本文探讨了KNN算法在class库中的实现，该实现引入了模糊近邻的概念，允许距离第三近邻相近的样本也被视为近邻。当K=3时，可能选择超过3个近邻，这取决于设定的阈值EPS。use.all参数决定了是否使用所有这些近邻进行投票。设置为TRUE将使用所有近邻，而FALSE则仅使用前K个。这种差异可能导致不同的预测结果。

摘要由CSDN通过智能技术生成

有时会使用class中的knn模型实现knn分类的功能

该库使用c语言实现底层功能，运行速度快，且参数数量少使用方便（knn本身参数也没啥）

knn(train, test, cl, k = 1, l = 0, prob = FALSE, use.all = TRUE)

但，其对于“近邻”的定义采用了“模糊”概念，与常规理解近邻稍有区别：

假设 K = 3，给定测试样例 X 和训练集 Train

传统理解中，从 Train 中找到与 X 距离最近的 3 个样例，进行多数投票确定 X 的预测类标；

class 实现中，从 Train 中可能找到 3 + n 个近邻样本，其中 3 是指传统理解中样例 X 的 3 个近邻样本，n 为与X与第三个近邻的距离“近似”相等的其他近邻样本

class 中设定了阈值 EPS = 1e-4，如果满足（样本Z与X的距离）<= (第K个近邻与X的距离) * (1+EPS)，则样本Z也选为近邻

那么，K=3时可能选择了多于3个近邻，此时如果

use.all = TRUE 时，使用所有这些样本投票；

use.all = FALSE 时，使用确定的K=3个近邻投票；

此时设定 use.all 的不同值可能会得到的不同的预测结果。

冰糖不在家

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【冰糖R语言】class 库实现 KNN 分类模型问题讨论

部分童鞋会使用class中的knn模型实现knn分类的功能该库使用c语言实现底层功能，运行速度快，且参数数量少使用方便（knn本身参数也没啥）但，其对于“近邻”的定义采用了“模糊”概念，与常规理解近邻稍有区别：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

冰糖不在家 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。