各算法参数详解

本文详细探讨了树模型中的决策树分类模型,包括其参数解释,如数据量占比(samples)和基尼指数(gini)。此外,还提及了LGB模型的相关内容。
摘要由CSDN通过智能技术生成

一、树模型

决策树分类模型

from sklearn import tree
import pydotplus #决策树可视化
from IPython.display import Image

Yt = df[train_y_col] # Y标签。
Xt = df[train_x_col].fillna(0) # X特征List
clf = tree.DecisionTreeClassifier(criterion='gini', # 选择切点使用的算法,默认是Gini系数。
                                  splitter='best', # 切点使用的方法,默认是best最优。
                                  max_depth=4, # 树的最大层数,一般最好四层以内。
                                  min_samples_split=100, # 最小切点样本量,低于这个数字则不再分支。
                                  min_samples_leaf=50, # 最小的叶子节点数,低于这个数字则不再分支。
                                  max_leaf_nodes=12, # 最大的叶子节点数,即最多这么多叶子,多余的将会被剪枝。
                                  class_weight={0:0.8,1:1}, # 标签0和1的样本权重。
                                  min_impurity_decrease=0.0) # 最小的信息熵阈值,低于这个数字则不再分支。
clf = clf.fit(Xt,Yt)
dot_data = tree.export
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值