RF框架参数
名称 | 解释 | 默认值 | 经验值 |
---|---|---|---|
n_estimators | 森林中决策树的个数 | 100 | |
criterion | 度量分裂标准 | (可选值)mse,mae | |
oobscore | 采用袋外样本来评估模型的好坏 | False | 推荐True 反应模型拟合后的泛化能力 |
RF决策树参数(和GBDT基本是相同的)
名称 | 解释 | 默认值 | 经验值 |
---|---|---|---|
max_features | RF划分时考虑的最大特征数 | auto(defult): 划分时最多考虑
N
\sqrt{N}
N个特征 log 2 N \log_2{N} log2N: 划分时最多考虑 log 2 N \log_2{N} log2N个特征 int(具体值),float(占总数的百分比) | |
max_depth | 决策树最大深度 | 可以不输入 | 10 ~ 100 |
min_samples_split | 内部节点再划分所需最小样本数 如果某节点的样本数少于该值,则不会继续再尝试选择最优特征来划分 | 2 | |
min_samples_leaf | 叶子节点最少样本数 | 1 | 如果样本量不大,可以不管这个值 |
n_jobs | 设定fit和predict阶段并列执行得任务个数 |