机器学习系列-最近邻分类器

最新推荐文章于 2022-05-26 21:12:38 发布

bubingy

最新推荐文章于 2022-05-26 21:12:38 发布

阅读量1.3k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bubingyang/article/details/78604198

版权

最近邻分类器

消极学习方法

一般的分类器，比如决策树和支撑向量机，只要有训练数据可用，它们就开始学习从输入属性到类标号的映射模型，这类学习策略被称为积极学习方法。与之相对的是消极学习算法，它的策略是推迟对训练数据的建模，在需要分类测试样例时再进行。消极学习的一个例子是Rote分类器，它记住整个训练集，只有当测试样例和某个训练样例完全匹配时才进行分类。这个分类算法有个明显的缺陷就是经常会出现测试样例不能被分类的情况，因为没有任何训练样例与它们匹配。

最近邻分类器

对Rote分类器稍加改进就可以使其更具灵活性，那就是找出和测试样例属性比较接近的所有训练样例，这些训练样例被称为最近邻，可以用来确定测试样例的类标号。这和“物以类聚，人以群分”是一个道理。最近邻分类器把每个训练样例看做 $d$ 维空间上的一个点，其中 $d$ 是属性个数，给定一个测试样例 $z$ ，计算 $z$ 与每个训练样例的邻近度，找出与之最近的 $k$ 个训练样例，将这 $k$ 个训练样例中出现最多的类标号赋给 $z$ 。

显然，这里 $k$ 的取值对分类结果的影响很大：如果 $k$ 太小，最近邻分类器容易受到训练样例中的噪声而产生过拟合的影响；如果 $k$ 太大，最近邻分类器容易误分类，因为最近邻列表中可能包含远离近邻的数据点。

要降低 $k$ 的选择造成的影响，一种途径就是根据每个最近邻 $x_i$ 距离的不同对其作用加权: $w_i=\frac{1}{d(x_i,z)^2}$ ，这样，距离较远的最近邻对分类结果的影响就相对较小。

最近邻分类器的优缺点

最近邻分类器的优点

不需要为训练集建立模型。
最近邻分类器可以生成任何形状的决策边界。

最近邻分类器的缺点

容易受到噪声的影响。
往往需要对训练集进行预处理才能使用。
每一次分类耗时长。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习系列-最近邻分类器

最近邻分类器消极学习方法一般的分类器，比如决策树和支撑向量机，只要有训练数据可用，它们就开始学习从输入属性到类标号的映射模型，这类学习策略被称为积极学习方法。与之相对的是消极学习算法，它的策略是推迟对训练数据的建模，在需要分类测试样例时再进行。消极学习的一个例子是Rote分类器，它记住整个训练集，只有当测试样例和某个训练样例完全匹配时才进行分类。这个分类算法有个明显的缺陷就是经常会出现测试样例不能被
复制链接

扫一扫

bubingy CSDN认证博客专家 CSDN认证企业博客

码龄9年

36: 原创

17万+: 周排名

43万+: 总排名

8万+: 访问

: 等级

1205: 积分

117: 粉丝

41: 获赞

6: 评论

108: 收藏

私信

关注

热门文章

最新评论

玩转python（7）python多协程，多线程的比较
bubingy 回复梦想呱: 哈哈，目前我也想不出具体的场景，但是不妨从这点来考虑：协程是协作式多任务，线程是抢占式多任务。并不是所有的应用场景都适合用多任务协作的方式：）
玩转python（7）python多协程，多线程的比较
梦想呱回复 bubingy: 那么楼主，想问下，协程优于多线程，那么是否可以使用协程代替多线程，以及什么情况下使用协程什么情况下使用多线程
玩转python（7）python多协程，多线程的比较
bubingy 回复 weixin_40672042: 我之前写的代码，t.join() 直接跟在 t.start()之后，因为t.join() 阻塞主线程，所以当前线程执行完之后才会进入下一个循环，相当于串行执行。如果你既要使用join()，又不想让他并发执行，只要让t.join() 和t.start() 不在一个循环体内就行。
玩转python（7）python多协程，多线程的比较
weixin_40672042: 你好，问一下多进程改进方案中，为什么：“如果调用join()阻塞主线程，那么相当于串行执行”
机器学习系列-主成分分析
bubingy 回复一个处女座的程序媛: 原来是前端大神，膜拜了（^-^）

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。