推荐系统笔记4-建立大规模分类模型

最新推荐文章于 2024-03-19 22:39:15 发布

年少_当自强

最新推荐文章于 2024-03-19 22:39:15 发布

阅读量1.3k

点赞数 1

分类专栏：机器学习推荐系统

本文链接：https://blog.csdn.net/buwei0239/article/details/86712665

版权

本文介绍了分类模型在推荐系统中的应用，包括点击率预估和用户偏好预测。模型构建方面，讨论了LR、FM、GBDT等模型，以及特征组合和选择的方法。同时，提到了模型融合策略，如GBDT+LR和DNN+GBDT。特征工程中，涉及了相关性、环境、热度和协同等特征类型。

摘要由CSDN通过智能技术生成

分类问题就是寻找一个超平面，分开不同标签的数据集。

一、分类模型应用

1.1、点击率预估模型：
1.1.1、 传统的以统计特征来做点击率预估，即用前几天的统计来做下一天的点击率预测，如下式所示：
在这里插入图片描述
其中ad_ctr表示历史的具体广告点击，cate_ctr表示一个具体的属性类别，可能包含多个ad类别，显然，当具体的广告数过小时，点击率不具备统计意义，所以需要用cate_ctr代表ad_ctr；
1.1.2、 模型做点击率预估，包括Logistic regression或者DNN等等，如下图所示：
在这里插入图片描述
1.1.3、 一般线上CTR预估系统示例如下：

也就是将一些数值特征用GBDT做离散化处理（GBDT具备组合特征能力），然后拼接原来的类别特征，使用FM训练模型并提取高阶特征，再次用LR训练ctr模型；

1.2、用户偏好预测
基于ItemCF的推荐算法调用示意图如下：
在这里插入图片描述
上述推荐算法的核心是三个部分，match->rank->rerank，其中这个算法会存在一个Trigger Selection Problem（触发选择问题）？这个问题是指物品冷启动吗（这里不甚理解）？那么我们可以借助用户偏好模型来帮助解决上面的问题；
用户偏好模型的作用主要是预测用户下⼀个浏览或者购买的类目、用户性别预测、用户年龄预测等，假设是物品冷启动问题，且预测用户下一个浏览的类别是A，如果新物品B和A相似，那么将B推荐给用户；
那么如何构造用户偏好模型呢？可以将其抽象化为基于时序行为的二分类模型（用户-商品对，标签喜欢-不喜欢），对于二分类模型，就涉及到特征部分，一般作如下处理：