随机森林RF、GBDT、XGBoost的区别

MusicDancing

已于 2024-01-23 16:13:45 修改

阅读量7.1k

点赞数 2

分类专栏：机器学习文章标签：机器学习

于 2021-08-14 23:41:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MusicDancing/article/details/119707982

版权

1. 随机森林

1.1 定义

RF是一个用随机方式建立的，包含多个决策树的集成分类器，其输出类别由各个树投票而定(回归树取平均)。

1.2 生成过程

假设样本总数为n，特征数为a。

1. 从原始样本中采用有放回抽样(bagging)的方法选取n个抽样。

2. 对n个样本选取a个特征中的随机k个，用于建立决策树的方法，获得最佳分割点。

3. 重复m次，获得m棵决策树。

4. 对输入样例进行预测时，每个子树都产生一个结果，采用多数投票机制输出。

1.3 优点

1. 实现简单，训练速度快，泛化能力强，可并行实现。（因为训练时树与树之间是相互独立的）。

2. 相比单一决策树，能学习到特征之间的相互影响，且不易过拟合。

3. 能处理高维数据，并且不用做特征选择，因为特征子集是随机选取的。

4. 对于不平衡的数据集，可以平衡误差。

5. 相比SVM，不是很怕特征缺失(待选特征也是随机选取的)。

6. 训练完后可以给出哪些特征比较重要。

1.4 缺点

1. 在噪音过大的分类和回归问题，还是容易过拟合。

2. 相比单一决策树，它的随机性让我们难以对模型进行解释。

2. 梯度提升树GBDT

2.0 boosting算法

一般boosting算法都是一个迭代过程，每一次的训练都是为了改进上一次的结果。算法原理：

1. 训练一个模型m1，产生错误e1；

2. 针对e1训练一个模型m2，产生错误e2；

3. 针对e2训练第三个模型m3，产生错误e3 .....；

4. 最终预测结果是：m1+m2+m3+.....

2.1 原理

gbdt是以决策树(回归树)为基学习器的迭代boosting算法。主要思想:

（1）每一次建立单个分类器时，是在之前建立的模型的损失函数的梯度下降方向；

损失函数越大，说明模型越容易出错，如果我们的模型能让损失函数持续的下降，则说明我们的模型在持续不断的改进，而最好的方式就是让损失函数在其梯度的方向上下降。

（2）GBDT的核心在于每一棵树学的是之前所有树结论和的残差；

残差就是真实值与预测值的差值，为了得到残差，GBDT中的树全部是回归树，而不是分类树。

最低0.47元/天解锁文章

博客等级

码龄5年

314
原创

536
点赞

1526
收藏

2421
粉丝

关注

私信

热门文章

分类专栏

pytorch 15篇
广告&推荐 8篇
nlp 7篇
大数据开发 10篇
机器学习工程 9篇
FK学习 21篇
用户画像 4篇
hive 14篇
深度学习 22篇
机器学习 38篇
pandas 10篇
读书笔记 4篇
python 28篇
spark 17篇
linux 23篇
docker 3篇
强化学习 6篇
mac 3篇
设备指纹 5篇
数据库 7篇
数据 8篇
诗词 5篇
图像处理 3篇
数据结构 20篇
tensorflow 2篇
scala 6篇
pyspark 5篇
java 5篇

展开全部收起

上一篇：: 支持向量机SVM简介

下一篇：: pyspark实现数据生产到parquet及hive表

最新评论

Wilson Score 排序算法
菩提树下呀: 早年间今日头条起家的核心算法，为字节跳动奠定基础的核心算法之一。去中性化的庞大能力，给了每个人崭露头角的机会。
hive json字段解析
m0_61432255: hive解析json高级案例实战：https://www.cnblogs.com/LIAOBO/p/16242061.html
Hive 中的window函数
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
一些基础知识FK
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
一些基础知识FK
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。