集成学习

在这里插入图片描述
集成学习有三类Bagging,Boosting,Stacking。

1.Bagging
在这里插入图片描述
并行学习一系列的弱学习器(实验证明以树模型作为弱学习器比较好)。
要想集成的结果比较好,不同的弱学习器差异越大越好(这个在机器学习技法笔记上有详细的推导)。为了体现差异性,一般采取数据采样随机,特征选择随机。当然还有很多其他的方法使随机性得到体现。
在这里插入图片描述
1.由于我们随机选择特征,所以特征多不是我们的问题。
2.为什么能选出比较重要的特征的?
在这里插入图片描述
我们用A,B,C,D四个特征训练一个模型,计算其错误率为e1,然后干扰B特征得到特征B’,用A,B’,C,D训练一个模型,计算其错误率为e2,如果e1和e2相似,则证明B特征不重要。
在这里插入图片描述
理论上越多的树效果越好,但是实际上基本超过一定数量就差不多就上下浮动了。

2.Boosting
Boosting相当于对树模型进行串联,A树进行预测得到的结果与真实结果有一个残差,然后B树对A树的残差进行预测,然后C树对A树和B树与真实结果的残差进行预测,一直这样下去。
在这里插入图片描述

3.Stacking
在这里插入图片描述

在这里插入图片描述
第一个阶段选取任意多的分类器,每个分类器都有各自的结果,然后第二阶段将第一阶段的结果当做特征数据进行输入进行训练。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值