随机森林

XIUXIU179

于 2018-04-16 17:01:53 发布

阅读量893

点赞数 3

分类专栏： R语言与数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiuxiu179/article/details/79962592

版权

随机森林是一种由多棵树组成的分类器，通过有放回抽样构建训练集，并随机选择特征进行节点分裂。该方法最初由Leo Breiman和Adele Cutler提出，每棵树都完全生长且不进行剪枝。在实践中，随机森林可用于数据分类，通过评估误差率和变量重要性来优化模型。在示例中，随机森林被应用于iris数据集，将数据分为训练集和测试集，最终进行测试并观察结果。

摘要由CSDN通过智能技术生成

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出，并被注册成了商标。

根据下列算法而建造每棵树：

用 N来表示训练用例（样本）的个数， M表示特征数目。
输入特征数目 m，用于确定决策树上一个节点的决策结果；其中 m应远小于 M。
从 N个训练用例（样本）中以有放回抽样的方式，取样 N次，形成一个训练集（即bootstrap取样），并用未抽到的用例（样本）作预测，评估其误差。
对于每一个节点，随机选择 m个特征，决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征，计算其最佳的分裂方式。
每棵树都会完整成长而不会剪枝，这有可能在建完一棵正常树状分类器后会被采用）。

随机森林的优点有：

1）对于很多种资料，它可以产生高准确度的分类器；

2）它可以处理大量的输入变数；

3

最低0.47元/天解锁文章

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。