机器学习（8）

Mr. Morningstar

于 2022-06-19 18:42:47 发布

阅读量118

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46218732/article/details/125360860

版权

机器学习笔记------------------------------集成学习

集成学习

个体与集体

集成学习（ensemble learning）	构建并结合多个学习器来完成学习任务
基学习器	同质集成中的个体学习器
目的	通过结合多个学习期获得更优越的性能
投票法	少数服从多数，选择最终结果

醉着个体分类器数量增多，错误率会指数型下降

准确性与多样性相冲突

集成算法可分两类

个体学习期间存在强依赖关系，必须串行生成的序列化方法：boosting

个体学习器间不存在强依赖关系，可以同时生成的并行化方式：bagging、随机森林

Boosting

将弱学习器提升为强学习器的算法

先从训练集中练出一个基学习器，

再根据表现对样本重新调整，提高之气错误样本的地位，再训练

如此重复，直至达到数量要求，

最好将所有学习器加权结合

最著名的算法 adaboosting

Bagging与随机森林

想要得到泛化性能强的集成，个体学习器应该相互独立，可以考虑使用互有交叠的采样子集（不同、但有联系）

bagging	并行使集成学习方法最著名代表，基于自助采样法，主要关注降低方差
	bagging的一个扩展变体

结合策略

统计方面：减小误选导致泛化性能不佳的风险

计算方面：降低陷入局部极小的风险

表示方面：有可能获得更好的近似

对数值型输出的结合策略有平均法、投票法

简单平均法、加权平均法

绝对多数投票法（超过半数）、相对多数（数量最多即可）、加权投票

学习法典型代表stacking

多样性

误差-分歧分解

个体学习器准确性越高、多样性越大，集成越好

多样性度量

用于度量集成中个体分类器的多样性

多样性增强

数据样本扰动、输入属性扰动输出表示扰动、算法参数扰动

参考文献

周志华. 机器学习

Mr. Morningstar

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（8）

机器学习笔记------------------------------集成学习集成学习个体与集体集成学习（ensemble learning）构建并结合多个学习器来完成学习任务基学习器同质集成中的个体学习器目的通过结合多个学习期获得更优越的性能投票法少数服从多数，选择最终结果醉着个体分类器数量增多，错误率会指数型下降准确性与多样性相冲突集成算法可分两类个体学习期间存在强依赖关系，必须串行生成的序列化方法：boosting个体学习器间不存在强依赖关系，可以同时生成的并行化方式：bagging、随机森林Boo
复制链接

扫一扫

Mr. Morningstar CSDN认证博客专家 CSDN认证企业博客

码龄5年

13: 原创

120万+: 周排名

28万+: 总排名

5606: 访问

: 等级

133: 积分

4: 粉丝

3: 获赞

1: 评论

12: 收藏

私信

关注

热门文章

最新评论

Zotero论文格式去除DOI、链接、中英文可识别
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题中提到的去除DOI、链接以及中英文可识别的方法似乎非常实用。我相信这篇博客一定能帮助到很多人。感谢您持续不断地分享有价值的内容。对于下一步的创作建议，我想提出一点小建议。或许您可以考虑进一步探讨如何优化论文格式，以提高读者的阅读体验。例如，您可以分享一些关于如何排版论文以使其更易读、更具吸引力的技巧。这样的主题可能会引起更多读者的兴趣，同时也有助于提升他们的学术写作水平。再次恭喜您的努力和成果，期待您未来更多精彩的创作！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。