Boosting算法总结

最新推荐文章于 2023-11-20 09:15:40 发布

Catherine_In_Data

最新推荐文章于 2023-11-20 09:15:40 发布

阅读量655

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouwenyuan1015/article/details/105202112

版权

机器学习专栏收录该内容

25 篇文章 3 订阅

订阅专栏

Adaboosting:

通过前向分步法，优化损失函数，为指数损失函数，然后梯度上升树。
可以任意分类器作为弱分类器。
优化步长，与迭代次数。

GBDT

回归问题：
1）拟合残差
2）CART树
3）拟合负梯度
分类问题：
1)改变拟合Loss，比如：逻辑回归，对数损失， Adaboost 指数损失。
2）训练更精准
3）没法并行处理
调参
GBDT
n_estimators: 弱学习做大迭代次数
learing_rate: 权重缩减系数，也称作步长。)
subsample: 子采样，不放回抽样，防止过拟合。不能太小，负责偏差大。
随机森林是有放回抽样
loss: 回归选误差函数，分类选指数损失，或对数损失。
CART
1. max_feature: 最大特征树
  2）max_depth: 决策树最大深度，默认是3，数据多特征多一般限制使用
  3）mini_samples_split：内部节点再划分使用的最小样本数。
  4）mini_samples_leaf：叶子节点最少样本数。用于剪枝

XGBoost

优化方面
1）算法本身优化：
a. 弱分类模型选择上，可以支持更多弱分类器。
b. 损失函数上，添加正则化项，预防过拟合
c. 算法优化上，对误差做二阶泰勒展开，更加准备。 GBDT只做一阶泰勒展开。
2）算法运行效率
a. 每个弱分类器，建立过程并行选择，先对所有的特征的值进行排序分组，对分组特征，选择合适的分组大小，cpu缓存进行读取加速。
3）算法健壮性
a.缺失值特征，枚举所有缺失值进入左子树还是右子树决定缺失值处理方法。
调参
1）booster: 默认是gbtree CART,gblinear
2)e_estimators ：弱分类器个数
3）objective 分类，还是损失，以及对应的损失函数。

Catherine_In_Data

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Boosting算法总结

Adaboosting:通过前向分步法，优化损失函数，为指数损失函数，然后梯度上升树。可以任意分类器作为弱分类器。优化步长，与迭代次数。GBDT回归问题：1）拟合残差2）CART树3）拟合负梯度分类问题：1)改变拟合Loss，比如：逻辑回归，对数损失， Adaboost 指数损失。2）训练更精准3）没法并行处理调参GBDTn_estimator...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。