模型参数
n_estimatores: 总共迭代的次数,即决策树的个数 early_stopping_rounds: 在验证集上,当连续n次迭代,分数没有提高后,提前终止训练。防止overfitting。 max_depth: 树的深度,默认值为6,典型值3-10。值越大,越容易过拟合;值越小,越容易欠拟合。 min_child_weight: 默认值为1,。值越大,越容易欠拟合;值越小,越容易过拟合(值较大时,避免模型学习到局部的特殊样本)。 subsample: 训练每棵树时,使用的数据占全部训练集的比例。默认值为1,典型值为0.5-1。防止overfitting。 colsample_bytree: 训练每棵树时,使用的特征占全部特征的比例。默认值为1,典型值为0.5-1。防止overfitting。
常规参数
booster:
gbtree 树模型做为基分类器(默认)
gbliner 线性模型做为基分类器
silent:
silent=0时,输出中间过程(默认)
silent=1时,不输出中间过程
Verbosity: 打印消息的详细程度
有效值为0(静默),1(警告),2(信息),3(调试)
nthread:
nthread=