机器学习——随机森林

最新推荐文章于 2024-08-10 19:55:09 发布

冠long馨

最新推荐文章于 2024-08-10 19:55:09 发布

阅读量3.6k

点赞数

分类专栏：机器学习与大数据分析文章标签：机器学习随机森林决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/koulongxin123/article/details/122967348

版权

随机森林是一种通过构建多棵决策树并结合其预测来减少过拟合的机器学习算法。每棵树使用随机子集的样本和特征进行训练，提高了模型的泛化能力。重要参数包括n_estimators、max_depth等，可以通过参数调整和特征选择优化模型性能。

摘要由CSDN通过智能技术生成

文章目录

参考资料
1. 生成算法
2. 随机森林的特点
- 2.1 随机森林的随机性
- 2.2 随机森林的优势
3. 随机森林的优化

参考资料

[1] 王小王-123：https://wxw123.blog.csdn.net/article/details/122831189

决策树的一个主要缺点在于经常对训练数据过拟合。随机森林是解决这个问题的一种方法.
随机森林中树的随机化方法有两种：一种是通过选择用于构造树的数据点，另一种是通过选择每次划分测试的特征。

1. 生成算法

从样本集中通过自助采样产生n个样本
假设样本特征数目为a，对n个样本选择a中的max_features个特征，用建立决策树的方式获得最佳分割点。
重复步骤1、2m次，产生m棵决策树

2. 随机森林的特点

2.1 随机森林的随机性

每一棵树的训练集是在训练集种通过自助采样产生的
构建树时的分割特征不是所有特征之间最优的。被选中的特征是在所有特征的随机子集种的最好分割。

2.2 随机森林的优势

能完成隐含特征的选择，并且提供一个特征重要度的选择指标。
训练速度快。
通用性：能够处理回归和分类问题
简洁性
相比于决策树算法，随机森林更不容易陷入过拟合。
能够处理高维度的数据，并且不用做特征选择。
对数据集的适应能力强：既能处理离散型数据，也能处理连续型数据，数据集无需规范化

3. 随机森林的优化

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

冠long馨 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。