随机森林

最新推荐文章于 2023-02-25 14:57:34 发布

会飞的犬良

最新推荐文章于 2023-02-25 14:57:34 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：集群学习随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/things_use/article/details/103028556

版权

随机森林是一种基于决策树的集成学习方法，通过多次随机抽样和特征选择构建多棵树，通过投票决定最终结果，避免过拟合。特征选择通过对比加噪声前后袋外数据误差来评估特征重要性。

摘要由CSDN通过智能技术生成

1.随机森林介绍

随机森林是在建立在决策树之上的。只要明白了决策树的概念以及算法，那么随机森林就特别简单了。随机森林就是用多个决策树的结果来决定最终的结果，所以在训练过程中，我们会利用训练数据生成多个决策树。其算法的基本步骤如下：

（1）原始训练集为N，应用bootstrap法有放回地随机抽取k个新的自助样本集，并由此构建k棵分类树，每次未被抽到的样本组成了k个袋外数据；

（2）设有mall个变量，则在每一棵树的每个节点处随机抽取mtry个变量(mtry n mall)，然后在mtry中选择一个最具有分类能力的变量，变量分类的阈值通过检查每一个分类点确定；

（3）每棵树最大限度地生长, 不做任何修剪；

（4）将生成的多棵分类树组成随机森林，用随机森林分类器对新的数据进行判别与分类，分类结果按树分类器的投票多少而定。

第1步，我们具体做法是假如有N个数据，我们构建每个决策树的时候，只随机抽取其中的一部分数据，假如2/3，其余的1/3我们作为该随机树的袋外数据，也就是测试数据。至于有放回的抽取，是对于每个数据，可能在不同的决策树中都存在。

第2步，每棵树的每个节点

最低0.47元/天解锁文章

会飞的犬良

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。