邻近取样算法

最新推荐文章于 2024-04-12 00:20:24 发布

程序猿蓝桉

最新推荐文章于 2024-04-12 00:20:24 发布

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a3464684/article/details/85248471

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、最邻近规则分类KNN算法

1、输入基于实例的学习，即懒惰学习

2、算法步骤

选择参数K

计算未知实例与所有已知实例的距离

选择最近的K个已知实例

根据少数服从多数的投票法则，让未知实例归类为K个最邻近样本中最多次的类别

3、细节

K的选择：K的值（1,3,5,7等必须为奇数个点）通过实际的实验测试来进行参数的优化看哪个参数优化程度最高。

关于距离的衡量方法：Euclidean Distance 定义，即是两点之间的距离

其余距离的衡量：余弦值，相关度，曼哈顿距离（即X走多少Y走多少）

4、该算法的优缺点：

优点：简单，易于理解，容易实现，通过对K的选择可以一定程度去除噪声干扰

缺点：需要大量存储空间，当其中样本分布不平衡，比如其中一类的样本过大占主导的时候，新的未知实例容易被归类为这个主导样本，

5、改进版本

考虑距离，根据距离加上权重

比如：1/d（d：距离）

程序猿蓝桉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
邻近取样算法

一、最邻近规则分类KNN算法 1、输入基于实例的学习，即懒惰学习 2、算法步骤选择参数K 计算未知实例与所有已知实例的距离选择最近的K个已知实例根据少数服从多数的投票法则，让未知实例归类为K个最邻近样本中最多次的类别 3、细节 K的选择：K的值（1,3,5,7等必须为奇数个...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。