个推教程--第七课--浅层排序模型gbdt

最新推荐文章于 2020-11-22 12:29:56 发布

Walter_Silva

最新推荐文章于 2020-11-22 12:29:56 发布

阅读量950

点赞数

分类专栏：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gin077/article/details/86363077

版权

推荐系统专栏收录该内容

10 篇文章 0 订阅

订阅专栏

gbdt和xgboost的详细介绍：https://wenku.baidu.com/view/44778c9c312b3169a551a460.html

回归树就是把连续取值区间分箱，叶子节点为一个个小的取值区间

基尼指数与熵的定义不同，熵是描述混乱状态的变量，熵越大混乱程度高；而基尼指数是指分类后分类节点左右子树下按类别衡量的纯度，纯度越高，基尼指数越小，该特征就越适合拿来作分类节点。

此处水下这个特征基尼指数更低，故选取它作为根节点

下面介绍梯度提升树

对上一轮分类错误的样本增大权重；对上一轮分类正确的样本降低权重；对基础model则相反

启发式学习，第二行为前向分布函数，每次迭代优化一棵树，而不是M个

根据上轮残差迭代

梯度提升树是把残差变成损失函数的负梯度在当前模型的取值，用这个取值模拟残差

下面是喜闻乐见的xgboost

相对gbdt，损失函数加入了正则项，但与gbdt用损失函数的负梯度来拟合当前残差不同，xgboost利用了泰勒级数展开，

xgboost的所有树都是回归树

树模型：将每个样本的输入落到某个叶子节点上，然后将叶子节点组成的高维特征送到lr中

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
个推教程--第七课--浅层排序模型gbdt

gbdt和xgboost的详细介绍：https://wenku.baidu.com/view/44778c9c312b3169a551a460.html回归树就是把连续取值区间分箱，叶子节点为一个个小的取值区间基尼指数与熵的定义不同，熵是描述混乱状态的变量，熵越大混乱程度高；而基尼指数是指分类后分类节点左右子树下按类别衡量的纯度，纯度越高，基尼指数越小，该特征就...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。