GBDT+LR

最新推荐文章于 2024-07-16 17:20:29 发布

蔡州小小胖

最新推荐文章于 2024-07-16 17:20:29 发布

阅读量244

点赞数

分类专栏：推荐系统文章标签：机器学习推荐系统 python

本文链接：https://blog.csdn.net/qq_38682028/article/details/109392234

版权

推荐系统专栏收录该内容

3 篇文章 0 订阅

订阅专栏

GBDT+LR模型结合了GBDT的特征筛选与组合能力及LR的简单高效。GBDT通过构建决策树序列减少残差，LR则利用新特征向量预测点击概率，常用于CTR预估。该模型能全面考虑多种特征，优化推荐系统中的点击率预测，简化特征工程流程。

摘要由CSDN通过智能技术生成

GBDT+LR

一、GBDT+LR是什么？

1.GBDT

GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种用于回归的机器学习算法，该算法由多棵决策树组成（但GBDT是回归树，不是分类决策树），所有树的结论累加起来做最终答案。当把目标函数做变换后，该算法亦可用于分类或排序。

2.LR

逻辑回归模型(Logistic regression，LR)，又称对数几率模型。

逻辑： 逻辑 $S i g m o i d$ 函数。 $f(x)=\frac{L}{1+e^{-k(x-x_0)}}$
其中 $x_0$ ：曲线上的一个 $x$ 值。
$L$ ：曲线的最大值
$k$ ：去县上logistic增长率或陡度
当 $x_0=0,L=1,k=1$ ，即标准逻辑Sigmoid函数。
回归： 回归分析着重在寻求变量之间近似的函数关系。

由于逻辑回归模型简单，可解释强，易实现，广泛应用于机器学习、推荐系统、计算广告等领域。

3.GBDT+LR模型

该模型利用GBDT自动进行特征筛选和组合，进而生成新的离散特征向量，再把该特征向量当做LR模
型的输入，来产生最后的预测结果，该模型能够综合利用用户、物品和上下文等多种不同的特征，生成较为全面的推荐结果，在CTR点击率预估场景下使用较为广泛。

二、逻辑回归

相比于协同过滤和矩阵分解利用用户的物品“相似度”进行推荐，逻辑回归模型将问题看成了一个分类问题，通过预测正样本的概率对物品进行排序。这里的正样本可以是用户“点击”了某个商品或者“观看”了某个视频，均是推荐系统希望用户产生的“正反馈”行为，因此逻辑回归模型将推荐问题转化成了一个点击率预估问题。而点击率预测就是一个典型的二分类，正好适合逻辑回归进行处理，那么逻辑回归是如何做推荐的呢？过程如下：