【机器学习】集成学习 Bagging Boosting 综述

最新推荐文章于 2024-06-16 23:02:21 发布

Tinkle2015

最新推荐文章于 2024-06-16 23:02:21 发布

阅读量371

点赞数

分类专栏：机器学习算法文章标签：集成学习 Ensemble learning

本文链接：https://blog.csdn.net/Tinkle2015/article/details/83859108

版权

算法同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

机器学习

12 篇文章 0 订阅

订阅专栏

集成学习 Ensemble learning：

主要包括三种形似的集成方式【Bagging、Boosting、Stacking】
       指将若干弱分类器 (或基(础)分类器) 组合之后产生一个强分类器（可以是不同类型的分类器）
       ·并不算是一种分类器，而是一种分类器的结合方法；
       ·一个集成分类器的性能会好于单个分类器；

1.Bagging 算法(bootstrap aggregation)：
       多个分类器同时对一个样本进行分类计算，对它们的结果取平均【并行训练，结果取平均值】
       设共有N个(弱)分类器, 第n个分类器的分类模型为 fn(x)
       则这个集成的强分类器的分类模型为 fa(x) = (1/N)Σ[fn(x)] 其中n = 1,2,...,N       【1.1】

·随机森林 (Random Forest):
           Bagging 思想的最典型代表
           随机:数据采样随机(采样量相同,常用0.6~0.8D),特征选择随机(特征选取量相同,常用0.6~0.8K,K为特征总数）
           森林:多个决策树并行放在一起

2.Boosting 算法(Boostrapping):
       一种把若干个(弱)分类器 (前后串联) 整合为一个(强)分类器的方法【串行训练，对前者的预测值相对真实值的残差弥补】
       对于一个含有 m-1 个弱分类器的模型fm-1(x)，在添加一个弱分类器 h(x) 后
       集成的强分类器的模型为：fm(x) = fm-1(x) + argmin_h { Σ[L(yi, fm-1(xi) + h(xi))] }        【2.1】
       【2.1】中函数 argmin_x { f(x) } 是指使得函数 f(x) 取得其最小值时所有自变量 x 的集合（f 取最小值时 x 的值）

Boosting
       |->XGBoost (Xtreme Gradient Boosting 极限梯度增强)
       |->AdaBoost (Adaptive Boosting 自适应增强)
       |->GBDT (Gradient Boosting Decision Tree 梯度提升决策树)
       |->LightGBM (Light Gradient Boosting Machine 轻量级梯度提升机)

Tinkle2015

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】集成学习 Bagging Boosting 综述

集成学习 Ensemble learning：主要包括三种形似的集成方式【Bagging、Boosting、Stacking】指将若干弱分类器 (或基(础)分类器) 组合之后产生一个强分类器（可以是不同类型的分类器） ·并不算是一种分类器，而是一种分类器的结合方法； ·一个集成分类器的性能会好于单个分类器； 1...
复制链接

扫一扫

专栏目录