《机器学习》周志华(西瓜书)学习笔记第八章集成学习

最新推荐文章于 2022-05-28 15:55:58 发布

Sundm@lhq

最新推荐文章于 2022-05-28 15:55:58 发布

阅读量1.3k

点赞数 1

分类专栏：机器学习西瓜书学习笔记文章标签：机器学习学习笔记集成学习周志华

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdm12345/article/details/93879544

版权

机器学习学习笔记4

总目录

第八章集成学习

8.1 个体与集成

集成学习 (ensemble learning) 通过构建并结合多个学习器来完成学习任务，有时也被称为多分类器系统(multi-classifier system) 、基于委员会的学习(committee-based learning) 等.

集成学习的一般结构:先产生一组"个体学习器" (individual learner)，再用某种策略将它们结合起来。
在这里插入图片描述

同质集成：只包含同种类型的个体学习器，例如"决策树集成" 中全是决策树，“神经网络集成"中全是神经网络。

同质集成中的个体学习器亦称基学习器 .

相应的学习算法称为基学习算法。

异质集成：包含不同类型的个体学习器，例如同时包含决策树和神经网络，异质集成中的个体学习器由不同的学习算法生成。个体学习器一般不称为基学习器，常称为"组件学习器” 。

集成学习通过将多个学习器进行结合，常可获得比单一学习器显著优越的泛化性能。这对弱学习器尤为明显。（弱学习器：泛化性能略优于随机猜想的学习器。）

虽然从理论上来说使用弱学习器集成足以获得好的性能，但在实践中出于种种考虑，例如希望使用较少的个体学习器，或是重用关于常见学习器的一些经验等，人们往往会使用比较强的学习器。要获得好的集成，个体学习器应"好而不同”，即个体学习器要有一定的准确性。并且要有"多样性" ，即学习器间具有差异。

考虑二分类问题 $y\ \epsilon \ \{-1.+1\}$ ，和真实函数 $f$ ，假定基分类器的错误率为 $ε$ ，即对每个基分类器 $h_i$ ，有：
$P(h_i(\bm{x}) =\not f(\bm{x}))=\epsilon$

假设集成通过简单投票法结合 T 个基分类器，若有超过半数的基分类器正确，则集成分类就正确:

$H(\bm{x})=sign(\sum_{i=1}^Th_i(\bm{x}))$

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《机器学习》周志华(西瓜书)学习笔记第八章集成学习

机器学习学习笔记4总目录第八章集成学习8.1 个体与集成集成学习的一般结构:先产生一组"个体学习器" (individual learner)，再用某种策略将它们结合起来。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。