集成学习

最新推荐文章于 2024-04-25 18:02:29 发布

仍歌

最新推荐文章于 2024-04-25 18:02:29 发布

阅读量235

点赞数

分类专栏：机器学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ruggier/article/details/90679721

版权

集成学习通过组合多个学习器提升整体性能，包括Boosting（降低偏差）和Bagging（降低方差）策略。Boosting通过调整样本权重训练基学习器，而Bagging采用自助采样法。随机森林在决策树基础上引入属性随机选择。结合策略包括平均法、投票法和学习法。关键在于平衡个体学习器的准确性和多样性。

摘要由CSDN通过智能技术生成

集成学习（ensemble learning）通过构建并结合多个学习器来完成学习任务

集成学习

集成中只包含同种类型的个体学习器，这样的集成是“同质”的（homogeneous），每个学习器被称为基学习器（base learner）。否则成为“异质”的（heterogeneous），这时个体学习器被称为组件学习器（component learner）或者直接成为个体学习器。

好的个体学习器应好而不同。但常常学习器的“准确性”和“多样性”是冲突的，在准确性较高的时候，要增加多样性就要牺牲准确性。

根绝个体学习器的生成方式，目前集成学习可以分为两大类，Boosting和Bagging。

Boosting

Boosting是一族可将弱学习器提升为强学习器的算法。这族算法的机制类似：先从初始训练集中训练一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器的表现在后续受到更多关注，然后基于调整后的样本分布训练下一个基学习器。

对于无法接受带权样本的学习算法，可以通过”重采样法“（re-sampling）处理，即在每一轮的学习中根据样本分布对训练集重新进行采样，再用重采样得到的样本集对基学习器进行训练

Bagging与随机森林

Bagging是并行式集成学习算法的代表。基于自助采样法，给定包含m个样本的数据集，按照又放回的采样m个样本，这样训练集中约有 $\%$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集成学习

集成学习（ensemble learning）通过构建并结合多个学习器来完成学习任务
复制链接

扫一扫

专栏目录

仍歌 CSDN认证博客专家 CSDN认证企业博客

码龄9年

20: 原创

31万+: 周排名

106万+: 总排名

6万+: 访问

: 等级

632: 积分

32: 粉丝

40: 获赞

21: 评论

289: 收藏

私信

关注

热门文章

分类专栏

最新评论

详解决策树、python实现决策树
seredrop: ID3算法这块少了好多字
详解决策树、python实现决策树
裤裤兔回复 Vinceshy: 感谢！
详解决策树、python实现决策树
Proton58: 102行改为下面的可以避免有些查询值的时候出现错误 [code=python] # 如果子集为空，则以当前集合中节点数目最多的标签作为子集的标签，为了防止到时查询的时候出现找不到值的错误 if not subDataset: tree[value] = max(list(labelCount.items()), key = lambda x:x[1])[0] continue [/code]
详解决策树、python实现决策树
Proton58 回复爱踢兔: 可以在前面加上list()，先把数据转换为列表这个作者的代码里面使用了许多迭代器，或许是为了加快代码运行速度，但是可以把迭代器转换为列表类型
详解决策树、python实现决策树
戴安娜的猫: {0: {0: 0, 1: 1, 'feature': 1}, 1: 1, 'feature': 2}怎么将这个转化成树呀？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。