集成学习（1）——集成学习的种类

最新推荐文章于 2024-07-05 14:52:19 发布

有dian意思

最新推荐文章于 2024-07-05 14:52:19 发布

阅读量3.7k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43455338/article/details/104851679

版权

集成学习通过组合多个弱监督模型以构建强监督模型，降低方差或偏差，如AdaBoost、Random Forest和Stacking。它在数据集大小上都有适用策略，通过并行或序列方式训练基学习器，提高分类准确性。集成方法的特点在于多个分类器的聚集，通过投票或加权决策，通常优于单一分类器。

摘要由CSDN通过智能技术生成

简述

在机器学习的有监督学习算法中，我们的目标是学习出一个稳定的且在各个方面表现都较好的模型，但实际情况往往不这么理想，有时我们只能得到多个有偏好的模型（弱监督模型，在某些方面表现的比较好）。

集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型，集成学习潜在的思想是即便某一个弱分类器得到了错误的预测，其他的弱分类器也可以将错误纠正回来。集成方法是将几种机器学习技术组合成一个预测模型的元算法，以达到减小方差（bagging）、偏差（boosting）或改进预测（stacking）的效果。

集成学习在各个规模的数据集上都有很好的策略。

数据集大：划分成多个小数据集，学习多个模型进行组合
数据集小：利用Bootstrap方法进行抽样，得到多个数据集，分别训练多个模型再进行组合

集成学习的分类

集合方法可分为三类：

序列集成方法boosting
其中参与训练的基础学习器按照串行生成（例如 AdaBoost）。
基本思路：将基分类器层层叠加，每一层在训练的时候，对前一层基分类器分错的样本，给予更高的权重。测试时，根据各层分类器的结果加权得到最终结果。这样就利用基础学习器之间的依赖关系。通过对之前训练中错误标记的样本赋值较高的权重，可以提高整体的预测效果。
并行集成方法bagging
在训练过程中，参与训练的基学习器之间无强依赖ÿ

最低0.47元/天解锁文章

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

有dian意思 CSDN认证博客专家 CSDN认证企业博客

码龄6年

123: 原创

5万+: 周排名

2万+: 总排名

9万+: 访问

: 等级

1856: 积分

80: 粉丝

100: 获赞

16: 评论

453: 收藏

私信

关注

热门文章

分类专栏

最新评论

leetcode 二叉树
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
leetcode 二叉树
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
最小二乘支持向量机LSSVM
ning_xinyue: 请问一下博主代码有GitHub链接吗
Python机器学习笔记-1（线性回归）
wananz: 博主，np.matrix(x.values)执行不了导致后面的代码都会出现问题，这个要怎么解决呢？
最小二乘支持向量机LSSVM
有dian意思: 是的，这里的y应该是γ，用的手写输入公式出现了笔误，感谢提醒，谢谢

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。