随机森林(random forest)

最新推荐文章于 2024-05-04 08:21:41 发布

Distrlili

最新推荐文章于 2024-05-04 08:21:41 发布

阅读量2.2k

点赞数

分类专栏： R programing 文章标签：分类数据挖掘

本文链接：https://blog.csdn.net/G090909/article/details/52948407

版权

R programing 专栏收录该内容

34 篇文章 1 订阅

订阅专栏

刚开始接触它，以为这个方法只能用于分类，细细研究之后发现它既可以用于分类，又可以用于回归，此外，还能降维。

虽然都呈现出树状结构，但随机森林与CART树不同，后者只生成一颗树，而前者生成很多颗。由于随机森林会进行两次抽样，所以会生成很多随机树。当在基于某些属性对一个新的对象进行分类判别时，随机森林中的每一棵树都会给出自己的分类选择，并由此进行“投票”，森林整体的输出结果将会是票数最多的分类选项；而在回归问题中，随机森林的输出将会是所有决策树输出的平均值。

下面说明随机森林的规则：
在随机森林中，每一个决策树“种植”和“生长”的规则如下所示：

1.假设我们设定训练集中的样本个数为N，然后通过有重置的重复多次抽样来获得这N个样本，这样的抽样结果将作为我们生成决策树的训练集；

2.如果有M个输入变量，每个节点都将随机选择m(m

library(randomForest)
x<- cbind(x_train,y_train)
# Fitting model
fit<- randomForest(Species ~ ., x,ntree=500)
summary(fit)
#Predict Output
predicted= predict(fit,x_test)

Distrlili

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
随机森林(random forest)

刚开始接触它，以为这个方法只能用于分类，细细研究之后发现它既可以用于分类，又可以用于回归，此外，还能降维。虽然都呈现出树状结构，但随机森林与CART树不同，后者只生成一颗树，而前者生成很多颗。由于随机森林会进行两次抽样，所以会生成很多随机树。当在基于某些属性对一个新的对象进行分类判别时，随机森林中的每一棵树都会给出自己的分类选择，并由此进行“投票”，森林整体的输出结果将会是票数最多的分类选项；而在回
复制链接

扫一扫