Sklearn中决策树DecisionTree的参数设定

criterion参数

数据划分标准,默认gini,数据量较少的时候可以指定为entropy

random_state参数

主要作用类似对数据测试集的划分、模型创建、生成随机数据集的时候指定一个特定的ID,用于在后续使用过程中数据集等能够固定下来,方便模型的调优。

splitter参数

加上random参数能够使生成树的过程更加随机,减少过拟合问题。

剪枝参数

避免训练集上表现好但测试集表现糟糕的情况。剪枝策略对决策树的影响巨大,正确的剪枝策略是优化
决策树算法的核心。

  • maxdepth
    用于限制树的最大深度。应用较为广泛,在高纬度低样本量时较为有效。建议从3开始测试,看拟合效果。
  • min_samples_leaf
    一个节点在分枝后的每个子节点都必须包含至少min_samples_leaf个训练样本,否则分枝就不会发生,或者,分枝会朝着满足每个子节点都包含min_samples_leaf个样本的方向去发生用于可以使模型变得更加平滑。一般从5开始。
  • min_samples_spilit
    一个节点必须要包含至少min_samples_split个训练样本,这个节点才允许被分枝,否则分枝就不会发生。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值