随机森林模型的原理

最新推荐文章于 2024-07-01 20:31:03 发布

zhhu

最新推荐文章于 2024-07-01 20:31:03 发布

阅读量9.6k

点赞数

分类专栏： ML 文章标签：机器学习随机森林集成方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ahead_J/article/details/85538006

版权

随机森林模型是通过集成多个决策树来减少过拟合，采用Bootstrap采样技术确保每棵树训练在不同样本上，调整max_features参数控制特征选择，以实现多样性。在sklearn库中，RandomForestClassifier提供了相关API。该模型具有防止过拟合的优点，但需注意设置max_features以避免决策树相似度过高导致集成效果减弱。

摘要由CSDN通过智能技术生成

随机森林模型是集成模型的一种，它是由众多决策树集成得到的。

背景

当我们使用决策树模型的时候，会很容易发现它是易于过拟合的，对于决策树的过拟合有很多处理方法，譬如各种剪枝技术，而集成技术同样能够处理这一问题。我们通过集成技术生成各种不同的决策树，并综合考虑它们的预测结果，这样能够减少过拟合的出现机率。所以我认为训练随机森林模型的关键就在于如何产生不同形态的决策树。

Bootstrap采样

为了产生多种多样的决策树模型，我们会对数据进行采样，这样我们选用了Bootstrap采样技术，假设有n个样本可供训练，我们通过bootstrap技术对训练集进行n次采样，每次都从训练集中选择一个样本记录下索引并放回到训练集，这样我们最终得到的训练单颗决策树的模型也有n个样本，但是可能会有重复的样本存在，这样就保证了训练每颗决策树的数据集是不同的，从而产生不同形态的决策树。

Max_features

在训练时我们通过控制max_features参数来指定决策树只能选定部分特征进行划分数据集，

max_features = 1: 在每一层划分节点都是随机选择一个特征进行划分，这样就会生成很复杂的决策树，同时会使得各个决策树是不同的；

<

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
随机森林模型的原理

随机森林模型是集成模型的一种，它是由众多决策树集成得到的。背景当我们使用决策树模型的时候，会很容易发现它是易于过拟合的，对于决策树的过拟合有很多处理方法，譬如各种剪枝技术，而集成技术同样能够处理这一问题。我们通过集成技术生成各种不同的决策树，并综合考虑它们的预测结果，这样能够减少过拟合的出现机率。所以我认为训练随机森林模型的关键就在于如何产生不同形态的决策树。 Bootstrap采...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。