最常用的决策树预剪枝参数有两个:
- min_samples_split : 决策树某个节点的数据量小于该值时停止下分(注意该参数不能为1)
- max_depth:决策树的最大深度
# 最基本的决策树模型生成
from sklearn import tree
dtc = tree.DecisionTreeClassifier() # 回归决策树同理
dtc.fit(x_train, y_train)
# ---------------------------------------------------
# sklearn的GridSearchCV选择决策树预剪枝最佳参数
from sklearn