Boosting、Bagging和Stacking知识点整理

最新推荐文章于 2022-03-17 14:00:43 发布

ep_mashiro

最新推荐文章于 2022-03-17 14:00:43 发布

阅读量1.8k

点赞数

分类专栏：统计学习方法机器学习面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tinkle181129/article/details/79104757

版权

面试同时被 3 个专栏收录

33 篇文章 0 订阅

订阅专栏

统计学习方法

24 篇文章 0 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

全是坑，嘤嘤哭泣= =

简述下Boosting的工作原理
Boosting主要干两件事：调整训练样本分布，使先前训练错的样本在后续能够获得更多关注
集成基学习数目
Boosting主要关注降低偏差（即提高拟合能力）
描述下Adaboost和权值更新公式
Adaboost算法是“模型为加法模型、损失函数为指数函数、学习算法为前向分布算法”时的二类分类学习方法。
Adaboost有两项内容：提高那些被前一轮弱分类器错误分类样本的权值，而降低那些被正确分类样本的权值；加大分类错误率小的弱分类器的权值。
步骤一：初始化训练数据的权值分布，一开始赋予相同的权值 $\frac{1}{N}$
步骤二：多轮迭代
a. 带权的训练数据集进行学习，得到基本的二分类器 $G_m(x)$
b. 计算带权的分类误差率 $e_m=\sum_{i=1}^Nw_{mi}I(G_m(x_i)\neq y_i)$
c. 计算 $G_m(x)$ 的系数 $\alpha_m=\frac{1}{2}log\frac{1-e_m}{e_m}$
注: $\alpha_m$ 随 $e_m$ 的减小而增大，所以分类误差率越小的基本分类起在最终分类起中的作用越大，加大了分类错误率小的弱分类器的权值。
d. 更新训练数据集的权值分布
$w_{m+1,i}=\frac{w_{mi}}{Z_m}exp(-\alpha_my_iG_m(x_i))$
$Z_m=\sum_{i=1}^Nw_{mi}exp(-\alpha_my_iG_m(x_i)$
注意到 $G_m$ 是一个二分类器
步骤三：组合各个弱分类器
$f(x)=\sum_{m=1}^M\alpha_mG_m(x)$
请问（决策树、Random Forest、Boosting、Adaboost）GBDT和XGBoost的区别是什么？
而随机森林Random Forest是一个包含多个决策树的分类器。至于AdaBoost，则是英文”Adaptive Boosting”（自适应增强）的缩写，关于AdaBoost可以看下这篇文章《Adaboost 算法的原理与推导》。GBDT（Gradient Boosting Decision Tree），即梯度上升决策树算法，相当于融合决策树和梯度上升boosting算法。
@Xijun LI：xgboost类似于gbdt的优化版，不论是精度还是效率上都有了提升。与gbdt相比，具体的优点有： 1.损失函数是用泰勒展式二项逼近，而不是像gbdt里的就是一阶导数 2.对树的结构进行了正则化约束，防止模型过度复杂，降低了过拟合的可能性 3.节点分裂的方式不同，gbdt是用的gini系数，xgboost是经过优化推导后的

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ep_mashiro CSDN认证博客专家 CSDN认证企业博客

码龄10年

196: 原创

7万+: 周排名

139万+: 总排名

20万+: 访问

: 等级

3685: 积分

130: 粉丝

98: 获赞

43: 评论

240: 收藏

私信

关注

热门文章

分类专栏

Leetcode-Solution 16篇
python 152篇
leetcode 136篇
html 2篇
统计学习方法 24篇
latex 1篇
一锅乱炖 5篇
推荐系统 13篇
mysql 4篇
机器学习 21篇
Array 24篇
Heap 1篇
DC 3篇
TwoPoints 5篇
Math 4篇
Bit 2篇
HashTable 3篇
BinarySear 7篇
Greedy 1篇
DP 3篇
Backtrack 1篇
Design 1篇
面试 33篇
机试 19篇
集成学习 1篇
计算广告 3篇
DFS 1篇
String 1篇
tensorflow 1篇

最新评论

latex 自定义bst文件
mklianhnu: 您好，请问您的问题解决了吗？我也处理不了
coursera公开课——recommender system作业（第二周）
yypSandra: 请问可以共享一下下载的数据集吗，我下载不下来了，谢谢啦
latex 自定义bst文件
qq_40741498: 博主，请问怎么将Fig. 1:改成Fig. 1.呢？这个冒号怎么变成点，我尝试好久了
latex 自定义bst文件
qq_42102915: 您好，我生成.dbj格式后也不知道如何生成.bst文件，请问您已经解决这个问题了吗？我使用的是texstudio，不知道文章中第四条提到的dos窗口是哪个，也不知道如何用tex命令编译.dbj文件。
latex 自定义bst文件
xml98: 您好，我用这个方法得到了.dbj文件，但是无论如何就是弄不出来.bst文件。您遇到过这种情况吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。