【机器学习】集成学习笔记

1. 基础知识

  • 概念:集成学习(ensemble learning)先产生出一组“个体学习器”,再用某种策略将它们结合起来。这些个体学习器可以类型相同,也可以不同。
  • 集成学习通过将多个学习器进行集合,常可获得比单一学习器显著优越的泛化性能,但有一个小条件——这些个体学习器至少不差于弱学习器(泛化性能略优于50%的学习器)。这次融合我的XGBOOST和Andy的GBDT结果集得到了非常好的提升效果的,我认为就很好地佐证了集成学习这个理念的正确性。
  • 集成个体最好是“好而不同”的(一个二分类任务的例子)。这个“不同”指基学习器之间要有差异,同时误差尽可能相互独立(虽然这是不可能的)。   基学习器的“准确性”+“多样性”之间的平衡就是集成学习研究的核心。虽然“独立”在现实中无法做到,但可以使基学习器之间有具有较大的差异。比如给定一个训练集,我们可以有交叠地采集子集来训练出不同的基学习器,这种方法提示我在O2O优惠券赛中,可以抽样产生多个训练集来训练出多个模型,最后对预测结果进行融合。
  • 分类:序列化方法(代表是Boosting)和并行化方法

 

2.Boosting

  • 概述:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后根据调整后的样本分布来训练下一个基学习器;如此重复进行,直到基学习器数目达到事先指定的数目T,最终将这T个基学习器进行加权结合。
  • 代表算法:Adaboost(加性模型迭代  指数损失函数࿰
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值