随机森林的重要参数(分类器和回归器)

一、随机森林的分类器 (RandomForestClassififier)

随机森林分类器的重要参数:criterion、 splitter、max_depth、min_samples_leaf &min_samples_split、max_features & min_impurity_decrease具体的使用可参考DecisionTreeClassifier重要参数、属性、接口(实现一棵树,随机性参数)这篇的使用。

n_estimators:森林中数木的数量,即基评估器的数量,这个参数的数量越大,模型的效果越好。

# 随机森林的重要属性之一:estimators_,查看森林中树的状况
     例如:rfc.estimators_

random_state :用来表示生成同一片森林。

bootstrap bootstrap 参数默认 True ,代表采用这种有放回的随机抽样技术。
oob_score : 袋外数据 (out of bag data ,简写为 oob) 在使用随机森林时,我们可以不划分测试集和训练集,只需要用袋外数据来测试我们的模型即可。 oob_score_来查看我们的在袋外数据上测试的结果

如:

rfc = RandomForestClassifier(n_estimators=25,oob_score=True)
rfc = rfc.fit(wine.data,wine.target)
#重要属性oob_score_
rfc.oob_score_

重要属性.estimators_ .oob_score_

有四个常用接口apply, fit, predictscore

二、随机森林的回归器(RandomForestRegressor )

criterion
回归树衡量分枝质量的指标,支持的标准有三种:
1 )输入 "mse" 使用均方误差 mean squared error(MSE),被看作是一种损失。
2 )输入 “friedman_mse” 使用费尔德曼均方误差
3 )输入 "mae" 使用绝对平均误差 MAE mean absolute error
在回归树中, MSE 不只是我们的分枝质量衡量指标,也是我们最常用的衡 量回归树回归质量的指标.
回归树的接口 score 返回的是 R 平方,并不是 MSE
 
重要属性和接口: apply, fifit, predict score
 
R平方的取值是负无穷到1,虽然均方误差永远为正,但是sklearn当中使用均方误差作为评判标准时,却是计算“负均方误差”。
没有 predict_proba 这个接口
 
三、注意事项:
在sklearn中sklearn.impute.SimpleImputer 来轻松地将均值,中值,或者其他最常用的数值填补到数据中。

 

  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值