随机森林详解

本文详细介绍了随机森林算法,包括其基本原理、分类器的使用、回归器的应用及优化策略。通过实例展示了随机森林在分类和回归任务中的表现,并通过交叉验证和参数调整寻找最佳性能。
摘要由CSDN通过智能技术生成

随机森林是由Leo Breiman和 Adele Cutler发展的分类和回归算法,使用了大量的决策树模型,从而通过降低估计的偏差和方差来提高精确的预测。

作为开箱即用的算法,随机森林算法的执行步骤主要如下:

  1. 创建大量决策树,每棵树之间都不一样,基于观察点和变量的不同子集。
  2. 为每棵树用自助法(bootstrap)来采样观察数据集(用置换法从原始数据采样)。相同的观察点可以在相同的数据集出现多次
  3. 为每棵树随机选择并仅适用一部分变量。
  4. 适用由采样所排除的管擦点来估计每棵树的性能。
  5. 在全部数据被拟合和预测后,获取最终预测,即为回归估计的平均值或用于预测的最频繁类。

一、使用随机森林分类器

#使用bagging 模仿随机森林
#载入手写数字数据集
from sklearn.datasets import load_digits
digit = load_digits()
X, y = digit.data, digit.target

from sklearn.ensemble import RandomForestClassifier
from sklearn.cross_validation import cross_val_score
from sklearn.cross_validation import KFold
crossvalidation = KFold(n=X.shape[0], n_folds=5, shuffle=True, random_state=1)
RF_cls = RandomForestClassifier(n_estimators=300)
score = np.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值