R语言与随机森林

随机森林算法(Random Forest)

  • 由很多决策树分类器组合而成
  • 单个的决策树分类器用随机方法构成:首先,学习集是从原训练集中通过有放回抽样得到的自助样本。其次,参与构建该决策树的变量也是随机抽出,参与变量数通常嗒嗒小于可用变量数。
  • 单个决策树在产生学习集和确定参与变量后,使用CART算法计算,不剪枝。
  • 最后分类结果取决于各个决策树分类器简单多数选举。

随机森林算法优点

  • 准确率可以和AdaBoosting算法媲美
  • 对错误离群点更加具有鲁棒性
  • 决策树容易过度拟合的问题会随着森林规模的增加而削减
  • 在大数据量的情况下,随机森立算法速度快,性能好

随机森林计算实例

对IRIS数据集建立随机森林分类模型并预测分类结果。从输出结果可见,随机森林对该数据集的分类预测的准确性为100%。

image

为对比随机森林的预测结果,下面使用ID3决策树算法进行分类预测:

image

对比表示,在使用ID3决策树算法对IRIS数据集进行分类预测的时候。在Versicolor和Virginica属性上,分别出现了5个和1个错误预测。可见,随机森林算法在准确度上的优越性。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值