在随机森林方法中,创建大量的决策树。每个观察被馈入每个决策树。每个观察的最常见的结果被用作最终输出。新的观察结果被馈入所有的树并且对每个分类模型取多数投票。
对构建树时未使用的情况进行错误估计。这称为OOB(袋外)误差估计,其被提及为百分比。
R语言包“randomForest”用于创建随机森林。
安装R包
在R语言控制台中使用以下命令安装软件包。您还必须安装相关软件包(如果有)。
install.packages("randomForest)
包“randomForest”具有函数randomForest(),用于创建和分析随机森林。
语法
在R语言中创建随机森林的基本语法是 -
randomForest(formula, data)
以下是所使用的参数的描述 -
formula是描述预测变量和响应变量的公式。
data是所使用的数据集的名称。
输入数据
我们将使用名为readingSkills的R语言内置数据集来创建决策树。它描述了某人的readingSkills的分数,如果我们知道变量“age”,“shoesize”,“score”,以及该人是否是母语。
以下是示例数据。
# Load the party package. It will automatical