xgboost

最新推荐文章于 2019-05-22 15:36:12 发布

ae5555

最新推荐文章于 2019-05-22 15:36:12 发布

阅读量2.5k

点赞数 6

分类专栏：工具使用文章标签： xgboost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ae5555/article/details/73849647

版权

工具使用专栏收录该内容

15 篇文章 0 订阅

订阅专栏

xgboost构建过程

xgboost 从顶到底构建树，在从低到顶反向进行剪枝。
xgboost的并行不是tree粒度的，而是在特征粒度上的。决策树学习中最耗时的一个步骤是对特征的值进行排序，xgboost在训练之前，预先对数据进行了排序，保存为block结构，迭代中重复地使用这个结构。
在进行节点分裂时，需要计算每个特征的增益，最终选增益最大的那个特征去做分裂，各个特征的增益计算可以并行计算。
xgboost支持自定义目标函数和评估函数，只要目标函数二阶可导。
xgboost借鉴了随机森林的做法，支持column subsampling(特征采样)。
5.

booster : tree、linear

参数

eta 收缩步长，缺省值=0.3，通常设置为[0.01,0.2]。
减小eta，模型学习速度变慢，增加num_round。
gamma 最小分裂损失函数值，取值[0,+∞]。默认情况下，节点的划分需在loss 值大于0的情况下进行。
max_depth，树的最大深度，最大值为6。通常取值[3,10]。
min_child_weight , 孩子节点中最小的样本权重和。如果一个叶子节点的样本权重和小于该值则拆分过程结束。
subsample 训练数据采样率。
colsample_bytree 每个树对特征的采样率
colsample_bylevel 每次分割对特征的采样率
lambda L2 norm of leaf weights
alpha L1 norm one leaf weights

max_depth、min_child_weight、gamma直接控制模型的complexity，影响模型的过拟合程度；subsample、colsample_bytree 增加模型鲁棒性。

objective

默认为reg:linear , 这个参数定义需要被最小化的损失函数。
binary:logistic 二分类逻辑回归，返回预测的概率
multi:softmax 返回预测的类别，需要定义num_class。
multi:softprob 返回属于各个类别的概率。

eval_metric

默认值取决于objective的取值。对于回归问题，默认值为rmse，对于分类问题，默认值是error。

关注

6
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ae5555 CSDN认证博客专家 CSDN认证企业博客

码龄13年

143: 原创

19万+: 周排名

90万+: 总排名

18万+: 访问

: 等级

3383: 积分

21: 粉丝

19: 获赞

3: 评论

52: 收藏

私信

关注

热门文章

分类专栏

算法 17篇
机器学习 16篇
Hadoop&Spark 18篇
数学 3篇
程序语言 45篇
工具使用 15篇
linux 14篇
自然语言处理 6篇
问题集 20篇
Kafka&akka 6篇
检索 1篇
Docker 3篇

最新评论

Python/scikit-learn机器学习库(线性、二次判别分析)
sethG: [code=python] from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis qda = QuadraticDiscriminantAnalysis() qd = qda.fit(train_X,train_y).predict(test_X) print('正确率：',str(round(qda.score(test_X,test_y),2))) [/code] 搞QDA
java问题
多评技术: foreach迭代中移除倒数第二个元素不会抛出此异常
spark/MLlib 协同过滤算法
chengchengwoheni: 您好，源代码可以发我一份吗，邮箱1147841113@qq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。