XGBoost中参数min_child_weight的理解

最新推荐文章于 2024-03-19 22:45:00 发布

gg-123

最新推荐文章于 2024-03-19 22:45:00 发布

阅读量8.5k

点赞数 4

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012762419/article/details/102615702

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

我说一下自己的理解。参考https://stats.stackexchange.com/questions/317073/explanation-of-min-child-weight-in-xgboost-algorithm
1、对于回归问题，假设损失函数是均方误差函数，每个样本的二阶导数是一个常数，这个时候 min_child_weight就是这个叶子结点中样本的数目。如果这个值设置的太小，那么会出现单个样本成一个叶子结点的情况，这很容易过拟合。
2、对于分类问题，假设为二分类问题，损失函数为交叉熵，则每个样本的二阶导数可以写成几个因子相乘的形式，其中一项为sigmoid(y_hat)*(1-sigmoid(y_hat))。对分类问题，我们考虑叶子结点的纯度。假设某个叶子节点只包含一类，y = 1,那个这个节点有很大的可能是: 该节点包含的y_hat非常正，也就是我们给这个节点打分非常正，这个时候sigmoid(y_hat)非常接近1，上面的式子接近0；反之，假设某个叶子节点只包含y=0，情况也是类似的。从分析中可知，如果某个叶子结点的二阶导之和越小，或者越接近0，这个节点就越纯，这种情况下容易过拟合。

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
XGBoost中参数min_child_weight的理解

我说一下自己的理解。参考https://stats.stackexchange.com/questions/317073/explanation-of-min-child-weight-in-xgboost-algorithm1、对于回归问题，假设损失函数是均方误差函数，每个样本的二阶导数是一个常数，这个时候 min_child_weight就是这个叶子结点中样本的数目。如果这个值设置的太小，那...
复制链接

扫一扫

专栏目录

gg-123 CSDN认证博客专家 CSDN认证企业博客

码龄11年

12: 原创

19万+: 周排名

74万+: 总排名

6万+: 访问

: 等级

661: 积分

11: 粉丝

35: 获赞

24: 评论

161: 收藏

私信

关注

热门文章

分类专栏

最新评论

word2vec中的CBOW模型
Upapa: 网上讲的都好模糊，你这个讲的真清楚！
tensorflow2实现DeepFM(基于DataFrame格式训练数据)
天悬丶星河: inputs = layers.RepeatVector(self.output_dim)(inputs) 博主你好，这一行代码为什么我运行时报错的。。后面加这个inputs是怎么回事
广告ctr中几个问题
zhipianxuan: 您好，我想请问一下模型训练时AUC是正常的，但是COPC偏离了很多，值达到40-50，但这是偶尔会出现这种情况，不是一直会偏。原因可能有哪些呀？比如模型结构是否存在问题？
广告ctr中几个问题
gg-123: mid-tag就是统计（用户ID，query）这个元组的统计ctr，设为c1; 然后看看这个这个元组在某个位置上的ctr值,设为c2，计算c1/c2，就是mid-tag的coec特征
广告ctr中几个问题
graycastle: 能讲下mid-tag， mid-ls，mid-ctype，tag-srctag的含义吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。