GBDT写的好的资料

最新推荐文章于 2021-02-17 11:36:51 发布

power0405hf

最新推荐文章于 2021-02-17 11:36:51 发布

阅读量1.8k

点赞数

分类专栏：机器学习数据挖掘文章标签：机器学习 GBDT 随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/power0405hf/article/details/72598488

版权

机器学习同时被 2 个专栏收录

11 篇文章

订阅专栏

3 篇文章

订阅专栏

首先是论文：Greedy Function Approximation: A Gradient Boosting Machine
GBDT理解二三事
 机器学习中的算法(1)-决策树模型组合之随机森林与GBDT
GBDT的wiki百科

RF的主要优点有：

1）训练可以高度并行化，对于大数据时代的大样本训练速度有优势。个人觉得这是的最主要的优点。
2）由于可以随机选择决策树节点划分特征，这样在样本特征维度很高的时候，仍然能高效的训练模型。
3）在训练后，可以给出各个特征对于输出的重要性
4）由于采用了随机采样，训练出的模型的方差小，泛化能力强。
5）相对于Boosting系列的Adaboost和GBDT， RF实现比较简单。
6）对部分特征缺失不敏感。

RF的主要缺点有：

1）在某些噪音比较大的样本集上，RF模型容易陷入过拟合。
2）取值划分比较多的特征容易对RF的决策产生更大的影响，从而影响拟合的模型的效果。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。