基本介绍
参数
-
criterion {“squared_error”, “friedman_mse”, “absolute_error”, “poisson”}, default=”squared_error”
衡量分割质量的函数。支持的标准有:
- "squared_error "为平均平方误差,相当于方差减少作为特征选择标准,使用每个终端节点的平均值使L2损失最小;
- “friedman_mse”,使用平均平方误差与Friedman改进得分来寻找潜在的分裂;
- "absolute_error "为平均绝对误差,使用每个终端节点的中位数使L1损失最小;
- “poisson”,使用减少泊松偏差来寻找分裂。
-
splitter {“best”, “random”}, default=”best”
用来选择每个节点的分割的策略。支持的策略是 "best "以选择最佳分割,"random "以选择最佳随机分割。
-
max_depth int, default=None
树的最大深度。如果没有,那么节点将被展开,直到所有的叶子都是纯的,或者直到所有的叶子包含的样本少于min_samples_split。
-
min_samples_split int or float, default=2
分割一个内部节点所需的最小样本数。
- 如果是int,那么考虑
min_samples_split
作为最小数量。 - 如果是float,那么
min_samples_split
是一个分数,ceil(min_samples_split * n_samples)
是每次分割的最小样本数。
- 如果是int,那么考虑
-
min_samples_leaf int or float, default=1
一个叶子节点所需的最小样本数。任何深度的分裂点只有在左右两个分支中至少留下
min_samples_leaf
训练样本时才会被考虑。这可能会产生平滑模型的效果,特别是在回归中。- 如果是int,那么考虑
min_samples_leaf
作为最小的数字。 - 如果是float&#
- 如果是int,那么考虑