form sklearn.ensemble import RandomForestClassifier as rfc
form sklearn.ensemble import RandomForestRegressor as rfr
参数
RFC需要调参可以分为两部分,一部分是bagging参数,另外一部分是决策树的参数。
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
n_estimators 基学习器的数量
n_jobs cpu核心数
oob_score 是否使用袋外样本进行评估
bootstrap True 不适用袋外样本进行建模
class_weight 少数民族万岁
random_state random_state
verbose Controls the verbosity when fitting and predicting.
warm_start:略
max_samples 当bootstrap is True,控制样本比例
ccp_alpha 不太懂
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
criterion ‘gini’ or ‘entropy’(分类)‘mae’,‘mse’(回归)
max_depth 单树的最大深度
min_samples_split 小于该值就不分叉了
min_samples_leaf 不太懂
max_features ‘auto’,‘log2’,‘sqrt’,int ,float
min_weight_fraction_leaf不太懂
max_leaf_nodes限制叶子数量
min_impurity_decrease 垃圾分叉淘汰
min_impurity_split 预剪枝要求
属性
base_estimator:基学习器
n_features_:使用的特征数量
estimators_:所有的基学习器list
oob_score_:带外数据评估分数
方法
.fit 训练
predict 预测
predict_proba预测,返回概率
predict_log_proba 预测,返回log概率
score 返回准确率