![](https://img-blog.csdnimg.cn/20201018230858328.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
推荐系统
记录推荐系统专题知识
星尘 StarDust
Datawhale团队成员,开源贡献者,一个不断寻找自我的追光者。
展开
-
推荐系统:GBDT+LR简介
1. GBDT+LR简介前面介绍的协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文信息等,导致生成的结果往往会比较片面。 而这次介绍的这个模型是2014年由Facebook提出的GBDT+LR模型, 该模型利用GBDT自动进行特征筛选和组合, 进而生成新的离散特征向量, 再把该特征向量当做LR模型的输入, 来产生最后的预测结果, 该模型能够综合利用用户、物品和上下文等多种不同的特征, 生成较为全面的推荐结果, 在CTR点击率预估场景下使原创 2020-10-30 21:44:46 · 807 阅读 · 0 评论 -
推荐系统:Wide & Deep模型解析
1. 点击率预估简介点击率预估是用来解决什么问题?点击率预估是对每次广告点击情况作出预测,可以输出点击或者不点击,也可以输出该次点击的概率,后者有时候也称为pClick。点击率预估模型需要做什么?通过上述点击率预估的基本概念,我们会发现其实点击率预估问题就是一个二分类的问题,在机器学习中可以使用逻辑回归作为模型的输出,其输出的就是一个概率值,我们可以将机器学习输出的这个概率值认为是某个用户点击某个广告的概率。点击率预估与推荐算法有什么不同?广告点击率预估是需要得到某个用户对某个广告的点击率,然后原创 2020-10-27 21:39:40 · 1484 阅读 · 0 评论 -
FM模型
1. FM模型的引入1.1 逻辑回归模型及其缺点FM模型其实是一种思路,具体的应用稍少。一般来说做推荐CTR预估时最简单的思路就是将特征做线性组合(逻辑回归LR),传入sigmoid中得到一个概率值,本质上这就是一个线性模型,因为sigmoid是单调增函数不会改变里面的线性模型的CTR预测顺序,因此逻辑回归模型效果会比较差。也就是LR的缺点有:是一个线性模型每个特征对最终输出结果独立,需要手动特征交叉(xi∗xjx_i*x_jxi∗xj),比较麻烦1.2 二阶交叉项的考虑及改进由于LR模原创 2020-10-25 20:21:20 · 697 阅读 · 0 评论 -
协同过滤算法概述
1. 协同过滤算法协同过滤(Collaborative Filtering)推荐算法是最经典、最常用的推荐算法。所谓协同过滤, 基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品(基于对用户历史行为数据的挖掘发现用户的喜好偏向, 并预测用户可能喜好的产品进行推荐),一般是仅仅基于用户的行为数据(评价、购买、下载等), 而不依赖于项的任何附加信息(物品自身特征)或者用户的任何附加信息(年龄, 性别等)。目前应用比较广泛的协同过滤算法是基于邻域的方法, 而这种方法主要有下面两种算法:原创 2020-10-22 16:36:34 · 7244 阅读 · 0 评论 -
推荐系统概述
传统推荐系统及深度学习推荐系统的演化关系图核心内容:协同过滤算法: 包括基于用户的协同过滤(UserCF)和基于商品的协同过滤(ItemCF),这是入门推荐系统的人必看的内容,因为这些算法可以让初学者更加容易的理解推荐算法的思想。矩阵分解算法: 矩阵分解算法通过引入了隐向量的概念,加强了模型处理稀疏矩阵的能力,也为后续深度学习推荐系统算法中Embedding的使用打下了基础。FM(Factorization Machines): 该算法属于对逻辑回归(LR)算法应用在推荐系统上的一个改进...原创 2020-10-19 23:11:00 · 640 阅读 · 0 评论