【机器学习】集成学习基础概念介绍

文章介绍了集成学习的基本概念,如个体与集成的关系,以及集成学习的两大类型:平均方法(如Bagging和随机森林)和Boosting方法(如AdaBoost和梯度提升树)。此外,还讨论了常见的结合策略,包括平均法、投票法和学习法,如Stacking,以提高整体预测性能。
摘要由CSDN通过智能技术生成

前言

本文根据西瓜书总结了一些关键知识点,介绍了集成学习的原理、类型以及结合策略。、


1. 个体与集成

集成学习(ensemble learning)通过构建的并结合多个学习器来完成学习任务,有时也被成为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。 …… 通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。

个体学习器1
结合模块
个体学习器2
个体学习器3
个体学习器4
输出

2. 集成学习的两种类型

集成学习方法又可以大致分为两种;

1)平均方法:

代表算法是Bagging随机森林
原理是:构建几个独立的学习器,然后对其结果进行平均,通常表现都会比单一学习器好,因为方差也会减少。

2)Boosting方法:

代表算法是AdaBoost梯度提升树(Gradient Tree Boosting)
原理是:建立一个基学习器,然后根据基学习器的表现调整样本分布并用来训练下一个基学习器,不断重复这一步,直到得到T个基学习器(T是实现指定好的),最终将这T个学习器进行加权结合。

3. 结合策略

常见的结合策略包括: 平均法、投票法、学习法。

1) 平均法

包括简单平均(simpleaveraging) 和加权平均(weighted averaging)。加权平均的权重一般是从训练数据中学习而得,显示任务重的训练样本通常不充分或存在噪音,使得学习出的权重不完全可靠,容易导致过拟合。

  • 个体学习器性能相差较大时宜使用加权平均
  • 个体学习器性能相近时宜使用简单平均法

2)投票法

包括

  • 绝对多数投票法(majority voting):某标记得票过半,预测为该标记,否则拒绝预测
  • 相对多数投票法(plurality voting) :预测为得票最多的标记,若同时有多个标记获得最高票,则随机选取。
  • 加权投票法(weighted voting)

3)学习法

参考资料:
西瓜书第八章《集成学习》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值