R语言与随机森林

最新推荐文章于 2024-04-21 13:09:59 发布

Ethan_pika

最新推荐文章于 2024-04-21 13:09:59 发布

阅读量813

点赞数

分类专栏： R语言与机器学习文章标签：机器学习 R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yitian_z/article/details/103097455

版权

R语言与机器学习专栏收录该内容

16 篇文章 26 订阅

订阅专栏

随机森林算法（Random Forest）

由很多决策树分类器组合而成
单个的决策树分类器用随机方法构成：首先，学习集是从原训练集中通过有放回抽样得到的自助样本。其次，参与构建该决策树的变量也是随机抽出，参与变量数通常嗒嗒小于可用变量数。
单个决策树在产生学习集和确定参与变量后，使用CART算法计算，不剪枝。
最后分类结果取决于各个决策树分类器简单多数选举。

随机森林算法优点

准确率可以和AdaBoosting算法媲美
对错误离群点更加具有鲁棒性
决策树容易过度拟合的问题会随着森林规模的增加而削减
在大数据量的情况下，随机森立算法速度快，性能好

随机森林计算实例

对IRIS数据集建立随机森林分类模型并预测分类结果。从输出结果可见，随机森林对该数据集的分类预测的准确性为100%。

为对比随机森林的预测结果，下面使用ID3决策树算法进行分类预测：

对比表示，在使用ID3决策树算法对IRIS数据集进行分类预测的时候。在Versicolor和Virginica属性上，分别出现了5个和1个错误预测。可见，随机森林算法在准确度上的优越性。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
R语言与随机森林

随机森林算法（Random Forest）由很多决策树分类器组合而成单个的决策树分类器用随机方法构成：首先，学习集是从原训练集中通过有放回抽样得到的自助样本。其次，参与构建该决策树的变量也是随机抽出，参与变量数通常嗒嗒小于可用变量数。单个决策树在产生学习集和确定参与变量后，使用CART算法计算，不剪枝。最后分类结果取决于各个决策树分类器简单多数选举。随机森林算法优点准确率可以...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。