推荐news

最新推荐文章于 2024-10-10 12:45:12 发布

weixin_45149287

最新推荐文章于 2024-10-10 12:45:12 发布

阅读量102

点赞数

文章标签：机器学习深度学习数据挖掘

本文链接：https://blog.csdn.net/weixin_45149287/article/details/110787989

版权

排序模型

通过召回的操作，我们已经进行了问题规模的缩减，对于每个用户，选择出了N篇文章作为了候选集，并基于召回的候选集构建了与用户历史相关的特征，以及用户本身的属性特征，文章本省的属性特征，以及用户与文章之间的特征，下面就是使用机器学习模型来对构造好的特征进行学习，然后对测试集进行预测，得到测试集中的每个候选集用户点击的概率，返回点击概率最大的topk个文章，作为最终的结果。

排序阶段选择了三个比较有代表性的排序模型，它们分别是：

LGB的排序模型
LGB的分类模型
深度学习的分类模型DIN

得到了最终的排序模型输出的结果之后，还选择了两种比较经典的模型集成的方法：

输出结果加权融合
Staking（将模型的输出结果再使用一个简单模型进行预测）

总结

本章主要学习了三个排序模型，包括LGB的Rank， LGB的Classifier还有深度学习的DIN模型，当然，对于这三个模型的原理部分，我们并没有给出详细的介绍，请大家课下自己探索原理，也欢迎大家把自己的探索与所学分享出来，我们一块学习和进步。最后，我们进行了简单的模型融合策略，包括简单的加权和Stacking。