机器学习模型-随机森林(RandomForest)

最新推荐文章于 2024-06-19 14:27:57 发布

搬运工1627486

最新推荐文章于 2024-06-19 14:27:57 发布

阅读量4.3k

点赞数 4

分类专栏： Meachine Learning 文章标签： python RF

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40529535/article/details/86009850

版权

随机森林(RandomForest)：基于bagging集成的树模型

(一)基本原理

RF使用自助采样法(行采样)得到不同的训练子集，然后在子集上学习基学习器(CART树)。在建立CART树时，不是在所有特征中选择最优切分点，而是随机选择特征子集(列采样)然后在该子集中选择最优特征来分裂CART树。得到一系列基学习器后，综合它们的预测结果，作为集成模型的最终输出。

行采样、列采样的目的：增加随机性，从而降低集成模型的方差(偏差有所提高) 【本质是防止模型过拟合】

(二)特点

(优点)：可并行训练数据，在速度上有优势；可处理高维数据，无需特征选择

(缺点)：在噪声较大的分类或者回归问题上容易过拟合

(三)重要参数

n_estimators(基学习器数目)

max_depth(树模型最大深度) + max_features(切分树时特征子集中特征数目)+min_samples_split(分割节点含有的最小样本数)

(四)代码实现和函数调用

<

最低0.47元/天解锁文章

搬运工1627486

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
机器学习模型-随机森林(RandomForest)

随机森林(RandomForest)：基于bagging集成的树模型 (一)基本原理RF使用自助采样法(行采样)得到不同的训练子集，然后在子集上学习基学习器(CART树)。在建立CART树时，不是在所有特征中选择最优切分点，而是随机选择特征子集(列采样)然后在该子集中选择最优特征来分裂CART树。得到一系列基学习器后，综合它们的预测结果，作为集成模型的最终输出。行采样、列采样的目的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。