R语言随机森林初探

最新推荐文章于 2023-05-07 19:00:29 发布

JLOGAN

最新推荐文章于 2023-05-07 19:00:29 发布

阅读量7k

点赞数 4

分类专栏：数据挖掘文章标签： r语言随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ASSaSSINangJIE/article/details/52904042

版权

先介绍一下吧
在监督学习或者分类中，随机森林（RF）是一个非常好的分类学习算法。随机森林算法的实质是基于决策树的分类器集成算法，每一棵决策树给出一对实体的匹配决策，并根据所有的树的投票来得到最终决策。
基本思想：首先，通过自助法(bootstrap)重采样技术，从原始训练样本集N中有放回的重复随机抽取k个样本生成新的训练集样本集合，每个样本集合容量为k；其次，根据自助样本集生成k个决策树组成的随机森林，得到k种分类结果；最后，根据k种分类结果对每个记录进行投票表决来决定最终分类。
其实质是对决策树算法的一种改进，将多棵决策树组合在一起，每棵决策树的建立依赖于一个独立抽取的样本，形成森林中的每棵树都具有相同的分布，分类误差取决于每一棵决策树的分类能力和它们之间的相关性。步骤如下：
随机森林步骤
（1）首先我们用N表示原始训练集样本的个数，用M表示特征数目。
（2）从原始训练数据集中，应用bootstrap方法有放回地随机抽取k个新的自助样本集，并由此构建k棵分类回归树，每次未被抽到的样本组成了k个袋外数据（out-of-bag,OOB）。
（3）每个自助样本集生长为单棵决策树。在树的每个节点处从M个特征中随机挑选m个特征（m≤M），按照节点不纯度最小原则从这m个特征中选择一个特征进行节点分裂。
（4）每棵树都做最大限度的生长，不做任何

最低0.47元/天解锁文章

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
4
评论
R语言随机森林初探

先介绍一下吧在监督学习或者分类中，随机森林（RF）是一个非常好的分类学习算法。随机森林算法的实质是基于决策树的分类器集成算法，每一棵决策树给出一对实体的匹配决策，并根据所有的树的投票来得到最终决策。基本思想：首先，通过自助法(bootstrap)重采样技术，从原始训练样本集N中有放回的重复随机抽取k个样本生成新的训练集样本集合，每个样本集合容量为k；其次，根据自助样本集生成k个决策树组成的
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。