集成学习（一）：概述

最新推荐文章于 2023-05-24 21:31:30 发布

VoooWei

最新推荐文章于 2023-05-24 21:31:30 发布

阅读量277

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/VoooWei/article/details/82688313

版权

集成学习

集成学习

定义：
集成学习（Ensemble Learning）的目的是将多个弱分类器通过某种集合策略形成一个强学习器。弱分类器之间既要保证一定的差异性，其本身也要保证一定的准确性，即“好而不同”。差异性更多的是指弱分类器所关注的或提取的数据特征不同。例如KNN算法更关注的是数据之间的欧式距离，空间距离。而决策树，例如ID3则关注的是数据二分时其熵的变化。通俗的说就是三个臭皮匠赛过诸葛亮，而这三个臭皮匠都在待解决问题上都有特别的看法。
所以集成学习有两个重点内容需要关注：1）学习器 2）结合策略

学习器：

同种类型的弱学习器称为“同质”学习器，不同种类型的弱学习器称为“异质”学习器。学习器之间根据其“依赖程序”分为“强依赖”和“弱依赖”。“强依赖”的代表有强大的Boosting家族，主要目标在于减少bias（偏差），即提高模型在训练集上的精度。之所以说“强依赖”，因为下一个待训练的模型需要依赖上一个模型。模型1,2,3的训练呈现一种串行的模式。而“弱依赖”则可以同时训练多个模型，模型和模型之间没有特别大的关系。代表方法有Bagging，Random Forests（随机森林）等，其主要目标在于减少Variance（方差），降低模型的过拟合程度。

结合策略：
当多个弱学习器各自得出了预测结果，那么就需要一个好的结合策略采百家之长，得到最终的预测结果。如

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
集成学习（一）：概述

集成学习初识
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。