关于随机森林和GBDT的一些思考

最新推荐文章于 2021-09-03 15:27:02 发布

赵志雄

最新推荐文章于 2021-09-03 15:27:02 发布

阅读量923

点赞数

分类专栏：算法文章标签：随机森林 GBDT Random Forest 算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhixiongzhao/article/details/72773559

版权

算法专栏收录该内容

55 篇文章 0 订阅

订阅专栏

问1：随机森林产生过程？
答1：1)从原始数据集中采用有放回抽样，构造子数据集。自数据集数据量与原数据集相同，数据集间及数据集内元素可重复。
2)通过子数据集建立不同的决策树。随机森林的输出结果由不同决策树投票获得。
3)决策树建立过程中，待选特征随机获得。
4)使用bagging思想

问2：随机森林的优点有哪些？
答2：1)能够处理高纬度的特征，并且不用做特征选择
2)训练完成后，能够给出哪些特征比较重要
3)训练速度快，可以并行

问3：随机森林的缺点有哪些？
答3：1)噪音太大时容易产生过拟合

问4：GBDT产生过程？
答4：1)先使用全部样本建立第一棵树
2)计算1~(i-1)残差，第i棵树去拟合该残差
3)1~(i-1)残差 = 【样本真实值】- 【1~(i-1)棵树预测值之和】
4)使用boosting思想，每一次训练都是为了改进上一次结果

问5：GBDT如何避免过拟合？
答5：1)使用缩减思想。y(1 ~ i) = y(1 ~ i-1) + step * yi 其中，step~（0.01~0.001）
2)每次走一小步逼近结果，比每次迈一大步更容易避免过拟合

问6：GBDT的优点有哪些？
答6：1)可以解决非线性回归

问7：GBDT的缺点有哪些？
答7：1)无法并行化
2)对异常点敏感

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
关于随机森林和GBDT的一些思考

问1：随机森林产生过程？答1：1)从原始数据集中采用有放回抽样，构造子数据集。自数据集数据量与原数据集相同，数据集间及数据集内元素可重复。 2)通过子数据集建立不同的决策树。随机森林的输出结果由不同决策树投票获得。 3)决策树建立过程中，待选特征随机获得。 4)使用bagging思想问2：随机森林的优点有哪些？答2：1)能够处理高纬度的特征，并且不
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。