分类树的主要参数
DecisionTreeClassifier的八个参数
-
criterion
可选“entropy”和“gini”,默认gini系数 -
两个随机性相关的参数
random_state:随机的数阈大小,填一个数字即可。
splitter:控制决策树中的随机选项,可输入“best”或“random”。 -
五个剪枝参数
max_depth:控制决策树的最大深度,填数字即可。
min_samples_split:每个子节点要分枝最少需要特征样本数,填数字即可。
min_sample_leaf:一个节点在分枝后的每个子节点都必须包含至少这么些个训练 样本,否则分枝就不会发生,填数字即可。
max_feature:限制分枝时考虑的特征个数,多的特征将被舍弃。填数字即可。
min_impurity_decrease:min_impurity_decrease限制信息增益的大小,信息增益小于设定数值的分枝不会发生。 -
一个属性
feature_importances_:可以看每个特征的重要程度。 -
四个接口
fit:测试用
score:打分用
apply:返回每个测试样本所在的叶子节点的索引
predict:返回每个测试样本的分类回归结果