机器学习(六):集成算法(1)Bagging

本文深入探讨了集成算法中的Bagging方法,通过Bootstrap Aggregation(bagging)来减少模型的Variance。同时介绍了决策树CART的原理,包括如何进行分支、何时停止分支以及CART剪枝的正则化过程。接着,文章阐述了随机森林如何结合Bagging和决策树的优点,通过随机选取属性和OOB(out-of-bag)数据进行特征选择和性能评估。
摘要由CSDN通过智能技术生成

1.Aggregation概论

1.1 引言

三个臭皮匠,顶个诸葛亮。
假设我们有多个预测模型 g1,g2...gT ,能不能将这些模型组合起来,获得更好的性能?回想一下,之前我们Validation:是在多个模型中选择出一个好的模型,现在问题变成了:多个模型组合出一个更好的模型。
能不能呢?我们从直观上来看:
这里写图片描述
我们组合是有效果的。

1.2 这么多g是怎么获得的?

这里写图片描述
如果使用 H1,H2...HT ,那么aggregation算法的模型复杂度则 complexity(Tt=1Ht)

1.3 为什么aggregation可以起作用?

最终采用如下形式:

G(x)=1Tt=1Tgt(x)
假设我们试图预测的真实函数为f(x),那么每一个g都可以表示为:
gt(x)=f(x)+ϵt(x)
则G的预测的平方和误差的期望是:
E[(Gf(x))2]=E[(1Tt=1Tϵt(x))2]
,假设误差的均值是0,且不具有相关性,即
E[ϵt(x)]=0,E[ϵt(x)ϵu(x)]=0
则有
E[G(x
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值