GBDT梯度提升决策树+LR 逻辑回归推荐模型

长处四肢

于 2023-12-26 17:51:23 发布

阅读量84

点赞数

文章标签：决策树逻辑回归算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/luke991127/article/details/135227926

版权

GBDT梯度提升决策树+LR 逻辑回归推荐模型

（1）算法来源及背景：

【1】来源：

算法论文：Practical Lessons from Predicting Clicks on Ads at Facebook,2014 （Facebook经典CTR预估论文）

论文地址：http://quinonero.net/Publications/predicting-clicks-facebook.pdf

Facebook针对CTR预估场景，提出了GBDT+LR的算法框架，算法本质是利用GBDT梯度提升决策树的树模型的分类结果代替人工构造新特征。

【2】背景：

CTR场景样本数量大，点击率预估模型中的训练样本可达上亿级别
学习能力有限，以往的CTR预估采用LR模型，LR是线性模型，虽然速度较快，但是学习能力有限
人工成本高，为了更好的进行特征提取，提升LR的学习能力，需要采用人工特征工程，即通过人工方式找到有区分度的特征、特征组合。对人的要求高，时间成本高
希望算法能够自动发现有效的特征及特征组合，弥补人工经验不足，缩短LR实验周期

（2）算法原理：

【1】概述

具有stacking思想的二分类器模型用来解决二分类问题
通过GBDT将特征进行组合，然后传入给线性分类器
LR对GBDT产生的输入数据进行分类（使用L1正则化防止过拟合）

【2】GBDT自动特征构造原理

当GBDT训练好做预测的时候，输出的并不是最终的二分类概率值，而是要把模型中的每棵树计算得到的预测概率最大值所属的叶子结点位置记为1 => 构造新的训练数据

举例：

下图有2棵决策树，一共有5个叶子节点。
如果一个实例，选择了第一棵决策树的第2个叶子节点。
同时，选择第2棵子树的第1个叶子节点。
那么前3个叶子节点中，第2位设置为1，后2个叶子节点中，第1位设置为1。
concatenate所有特征向量，得到[0,1,0,1,0] 。
GBDT是一堆树的组合，假设有k棵树(T1,T2…Tk)，每棵树的节点数分别为Ni , GBDT会输出一个 ∑0�� 维的向量。

k)，每棵树的节点数分别为Ni , GBDT会输出一个 ∑0�� 维的向量。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
GBDT梯度提升决策树+LR 逻辑回归推荐模型

算法论文：Practical Lessons from Predicting Clicks on Ads at Facebook,2014 （Facebook经典CTR预估论文）当GBDT训练好做预测的时候，输出的并不是最终的二分类概率值，而是要把模型中的每棵树计算得到的预测概率最大值所属的叶子结点位置记为1 => 构造新的训练数据。Facebook针对CTR预估场景，提出了GBDT+LR的算法框架，算法本质是利用GBDT梯度提升决策树的树模型的分类结果代替人工构造新特征。
复制链接

扫一扫

长处四肢 CSDN认证博客专家 CSDN认证企业博客

码龄3年

11: 原创

135万+: 周排名

16万+: 总排名

2893: 访问

: 等级

123: 积分

10: 粉丝

11: 获赞

6: 评论

12: 收藏

私信

关注

热门文章

分类专栏

FLink 1篇

最新评论

Spark-RDD 简单总结
CSDN-Ada助手: 恭喜你写了第6篇博客！标题“Spark-RDD 简单总结”让我期待不已。你的持续创作令人佩服，而且这篇博客内容也非常有价值。如果可能的话，我建议你可以考虑在下一篇博客中探讨一下Spark-RDD的高级用法，这样我们就能更全面地了解这个主题。谢谢你的努力，期待你未来的创作！
行为数据——漏斗模型分析
CSDN-Ada助手: 恭喜您在博客领域持续创作，第11篇博客“行为数据——漏斗模型分析”内容丰富，对于数据分析领域的探索和分享给予了很好的启发。在下一步的创作中，或许可以考虑结合具体案例或者实际数据进行深入分析，让读者更加直观地理解漏斗模型分析的实际应用。希望您能继续保持创作的热情，不断提升自己的写作水平，期待您更多精彩的分享！
Flink双流Join数据重复问题如何解决？
CSDN-Ada助手: 恭喜作者能够持续创作，这篇关于Flink双流Join数据重复问题的博客内容非常有价值。对于解决这个问题，我想建议作者可以在下一篇博客中分享一些具体的案例分析或者实际操作经验，这样更能帮助读者理解和应用相关知识。希望作者能够继续分享更多有价值的内容，期待您的下一篇作品！
基础变声导论——个人学习用
CSDN-Ada助手: 恭喜您写了第7篇博客！看来您对基础变声有着深入的研究和学习。希望您能继续坚持创作，分享更多关于变声的知识和经验。下一步，可以考虑结合实际案例或者个人练习经历，向读者展示如何将基础变声理论运用到实际中。期待您的下一篇作品！祝您继续进步！
Flink全量聚合函数：apply和process这两种实现方法有什么区别？
CSDN-Ada助手: 恭喜你写了这么有深度的一篇博客！对于Flink全量聚合函数的apply和process两种实现方法进行了深入的探讨，让读者受益匪浅。希望你能继续保持创作的热情和耐心，接下来可以考虑结合实际案例进行分析，或者深入探讨Flink在大数据处理中的应用场景，这样会更加丰富你的博客内容。期待你更多的精彩分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。