集成学习算法学习笔记

m0_46521579

已于 2024-04-27 18:11:15 修改

阅读量551

点赞数 5

文章标签：集成学习算法学习

于 2024-04-27 17:33:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46521579/article/details/138249414

版权

一、集成学习的基本思想

三个臭皮匠顶一个诸葛亮

集成学习会考虑多个评估器的建模结果，汇总后得到一个综合的结果，以此来获取比单个模型更好的回归或分类表现。

很多独立的机器学习算法：决策树、神经网络、支持向量机

集成学习构建了一组基学习器，并将它们综合起来作为最终的模型。

在很多集成学习模型中，对基学习器的要求很低。

集成学习适用于机器学习的几乎所有领域：回归、分类、推荐和排序。

相同的多个基学习器不会带来任何提升，不同的模型取长补短，每个基学习器都会犯不同的错误，综合起来犯错的可能性不大。

上述数据集中，每个线性模型都不能成功将该数据集分类，3个线性模型的简单综合可将该数据集成功分类。

如何构建不同的学习器？

（1）采用不同的学习算法

（2）采用相同的学习算法，但使用不同的参数

（3）不同的数据集：不同的样本子集，在每个数据集中使用不同的特征

如何综合不同的基学习器？

（1）投票法（majority voting）：每个基学习器具有相同的权重

（2）有权重的投票（weighted voting）：可用不同的方法来确定权重

（3）训练一个新模型来确定如何综合：Stacking; 线性回归

主要的集成学习模式：

（1）Bagging：随机森林（random forest）

（2）Boosting：AdaBoost；Gradient Boosting Decision Tree

（3）Stacking

二、Bagging

boostrap aggregating 引导聚集算法

两个关键步骤：

（1）bootstrap取样

使用可重复取样从样本数为n的数据集中取出n个样本，假设每个样本被选中的概率是一样的

（2）模型综合

易于并计算

可以使用不在训练集Sj中的样本(out of bag sample, OOB)来估计基学习器的性能。

随机森林（Random Forests）

参数选择：

（1）决策数的数目m

（2）每个决策树的大小，由决策树叶节点所能包含的样本数的最大值决定

（3）每次选取最佳变量时随机选取的变量数d1

三、Boosting

boosting：提升

顺次建立一系列基学习器，后面的学习器分析当前已经建立的基学习器以更好的处理数据

（1）AdaBoost

（2）GBDT

基学习器的综合：一般使用有权重的线性组合；基学习器的权重一般由其性能决定

四、Stacking

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
集成学习算法学习笔记

三个臭皮匠顶一个诸葛亮集成学习会考虑多个评估器的建模结果，汇总后得到一个综合的结果，以此来获取比单个模型更好的回归或分类表现。很多独立的机器学习算法：决策树、神经网络、支持向量机集成学习构建了一组基学习器，并将它们综合起来作为最终的模型。在很多集成学习模型中，对基学习器的要求很低。集成学习适用于机器学习的几乎所有领域：回归、分类、推荐和排序。相同的多个基学习器不会带来任何提升，不同的模型取长补短，每个基学习器都会犯不同的错误，综合起来犯错的可能性不大。
复制链接

扫一扫

m0_46521579 CSDN认证博客专家 CSDN认证企业博客

码龄4年

140: 原创

104万+: 周排名

2万+: 总排名

13万+: 访问

: 等级

1531: 积分

90: 粉丝

99: 获赞

7: 评论

585: 收藏

私信

关注

热门文章

分类专栏

C++ 21篇
操作系统
CUDA 7篇
通信网络基础 12篇
Python
qt 5篇
opencv 2篇
ZYNQ 14篇
数字信号处理 15篇
计算机组成 1篇
openofdm 8篇
通信原理 9篇
其他 2篇
GD32 6篇
ZYNQ SDK 1篇
32 2篇
软件无线电基础 1篇
AD15 1篇
信号与系统 9篇
电磁场理论 4篇
随机信号分析 6篇
数字电路 3篇

最新评论

Verilog：状态机
NF8888: 言简意赅，感谢
多速率处理与滤波器设计
inprogram: 怎么抗混叠的呢？
数字电路笔记02：逻辑代数基础
m0_62574624: 可能没注意负逻辑规定高电平为逻辑0
论文笔记：Fast density-based clustering through dataset partitionusing graphics processing units
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
C++入门
toooooooool: 写的很不错，支持下

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。