12、集成学习——集成学习概述

healed萌

已于 2023-11-26 14:13:07 修改

阅读量916

点赞数 16

分类专栏：机器学习文章标签：集成学习机器学习人工智能

于 2023-11-23 19:09:03 首次发布

本文链接：https://blog.csdn.net/m0_56642803/article/details/134584299

版权

概念：

集成学习的思想是将若干个学习器(分类器&回归器)组合之后产生一个新学习器。弱分类器(weak learner)指那些分类准确率只稍微好于随机猜测的分类器(error rate < 0.5)
集成算法的成功在于保证弱分类器的多样性(Diversity)。而且集成不稳定的算法也能够得到一个比较明显的性能提升

作用：

集成方法分类为：

或者分类为串行集成方法和并行集成方法

1）Bagging思想（并行）（自举汇聚法，Bootstrap Aggregating ）

从训练集从进行子抽样组成每个基模型所需要的子训练集，对所有基模型预测的结果进行综合产生最终的预测结果。

在这里插入图片描述

第一步：在训练数据集中随机采样，对有m个样本训练集做T次的随机采样

随机采样：采集固定个数的样本，有放回的采样（每采样一个样本，都将样本放回）。一般是随机采集和训练集样本数m一样个数的样本。这样得到的采样集和训练集样本的个数相同，但是样本内容不同
第二步：训练一个基模型，对不同的子集进行训练，得到T个基模型。

Bagging方法的弱学习器可以是基本的算法模型，eg: Linear、Ridge、Lasso、Logistic、Softmax、ID3、C4.5、CART、SVM、KNN等。
第三步：T个基模型对测试数据进行预测，得到测试结果。
第四步：将T中结果综合起来。分类任务通常使用投票的方式得出结果，回归任务用平均的方式得到结果。
备注：Bagging方式是有放回的抽样