SPSS Modeler 集成学习算法之同质集成（第十五章）

最新推荐文章于 2024-04-10 11:10:47 发布

Yomi JIN

最新推荐文章于 2024-04-10 11:10:47 发布

阅读量1.4k

点赞数 1

分类专栏： IBM SPSS Modeler数据挖掘软件学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24339451/article/details/111356963

版权

在这里插入图片描述

前面小编和大家一起学习了若干分类器，一般情况下，我们在训练集上构建单个分类器解决问题。而对于集成学习算法，可以组合若干个基分类器，从而提升分类器的预测性能。通俗说，就是三个臭皮匠赛过诸葛亮。

如果基分类器的数量趋于无穷多，那么集成分类器的错误率是否会等于0呢？
不会，因为集成分类器错误率趋于0需要达到以下条件：
（1）基分类器的错误率要低于0.5%；
（2）基分类器之间相互独立。
一般的，我们是基于同一数据集进行分类器的训练，很难满足分类器间相互独立的条件。在实际中，只能尽量保证分类器之间不存在强相关的情况。当所有基分类器完全相关时，组合分类器的性能不会有任何改善。

同质集成：指所有基分类器都是由同一种算法所产生的。
同质集成学习方法：Bagging,Boosting,随机森林。

一、Bagging

Boostrap AGGregatING,也称为袋装法，是最为经典的并行集成算法。

1.1 过程：对原始训练数据集进行有放回的重复抽样达到目的。

<

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
SPSS Modeler 集成学习算法之同质集成（第十五章）

前面小编和大家一起学习了若干分类器，一般情况下，我们在训练集上构建单个分类器解决问题。而对于集成学习算法，可以组合若干个基分类器，从而提升分类器的预测性能。比如通俗说，就是三个臭皮匠赛过诸葛亮。如果基分类器的数量趋于无穷多，那么集成分类器的错误率是否会等于0呢？不会，因为集成分类器错误率趋于0需要达到以下条件：（1）基分类器的错误率要低于0.5%；（2）基分类器之间相互独立。一般的，我们是基于同一数据集进行分类器的训练，很难满足分类器间相互独立的条件。在实际中，只能尽量保证分类器之间不存在强相关的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。