【随机森林】原理，优缺点和应用场景

最新推荐文章于 2025-02-21 12:33:12 发布

数分面试加油

最新推荐文章于 2025-02-21 12:33:12 发布

阅读量5.5k

点赞数 1

分类专栏：机器学习文章标签：随机森林决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44910978/article/details/125118140

版权

机器学习专栏收录该内容

5 篇文章

订阅专栏

随机森林是以决策树作为基学习器的集成模型，特点是低方差低偏差，分成两部分，随机和森林。

原理/步骤：

有放回的随机抽取一部分样本建立决策树；（随机1）
建立决策树时，每一次都随机选取特征的子集进行不纯度的计算进行分割；（随机2）
最后基于所有决策树得到的结果，采取少数服从多数的方法得到最终结果。

优点：

由于两个随机性，模型的抗过拟合能力强，比较稳定；
能处理高维数据，不用做特征选择，还能得到特征重要性排序；
既可以用于分类，也可以用于回归；
既能处理离散型数据，也能处理连续型数据；
提供class_weight=balanced参数，可以处理不平衡数据。

缺点：

当数据维度过多时，由于会对每个特征的每个值进行不纯度计算，所以效率会比单纯决策树要慢；
无法给出连续的输出，生成的结果不会超出给定的训练集中结果的范围。

应用场景：既可以用于分类也可以用于回归问题，不适用于需要高实时的场景。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。