周志华《机器学习》——集成学习

本文详细探讨了集成学习中Boosting和Bagging两种策略,解释了如何生成个体学习器,以及如何评估和优化个体学习器集合。通过误差-分歧分解和多样性度量来判断个体学习器集的质量,并提出数据样本、输入属性、输出表示和算法参数扰动的策略以生成更适合集成的个体学习器。最后,讨论了结合多个个体学习器的平均法、投票法和学习法。
摘要由CSDN通过智能技术生成

1、怎样生成个体学习器

1.1 Boosting

Boosting的工作过程是:

Boosting算法的代表算法AdaBoost详解,可参照https://www.cnblogs.com/pinard/p/6133937.html

1.2 Bagging

Bagging算法的工作过程是:

Bagging的代表算法是随机森林,随机森林是利用决策树作为个体学习器算法,在决策树训练过程中引入和随机属性选择的Bagging算法。

2、如何判断个体学习器集好不好,适不适合集成

2.1 定性:误差-分歧分解

从理论上证明,个体学习器准确性越高,多样性越大,集成性越好

2.2 定量:多样性度量

(1)不合度量

(2)相关系数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值