《西瓜书》笔记08:集成学习

本文深入探讨集成学习,包括个体与集成的关系、Boosting算法的原理和实现,以及Bagging和随机森林的区别。文章指出,集成学习通过结合多个个体学习器以提升整体性能,强调个体的准确性和多样性。文中详细介绍了Boosting的重赋权和重采样法,以及Bagging和随机森林在样本和属性扰动上的差异。随机森林通过引入属性随机选择增强了多样性。此外,文章还讨论了结合策略和多样性的关键作用。
摘要由CSDN通过智能技术生成

因为是以李航的《统计学习方法》为主来看,将西瓜书作为补充。李航书的特点就是10个算法,每个推导,实例辅助,不拖泥带水,干货满满。西瓜书恰好弥补了李航书的不足,非常丰润,很多补充的小知识点。这篇是在整理李航书的boosting时补充其内容的。

1. 个体与集成

集成学习(ensemble learning)通过构建多个个体学习器并结合起来完成学习任务。

要获得好的集成,个体学习器应该“好而不同”,要有一定的“准确性”,即学习器不能太坏,并且要有多样性,之间具有差异。互为补充,才可提升效果。

集成学习研究核心:如何产生并结合个体学习器。

根据个体学习器的生成方式,集成学习大致分为两类:

{
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值