Recommender System
文章平均质量分 94
推荐系统
pyxiea
双鸭山大学研究生,对深度学习、自然语言处理、推荐系统感兴趣
展开
-
基于树的召回框架(三):Learning Optimal Tree Models under Beam Search
fffffffffffff原创 2021-04-12 15:54:07 · 1012 阅读 · 0 评论 -
基于树的召回框架(二):Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
阿里基于树结构的召回体系一共发了三篇paper,这是第二篇,其他两篇论文的阅读笔记见下方链接:论文笔记:Learning Tree-based Deep Model for Recommender Systems本文讲解论文的 supplementary files 下载,包括一些论断的证明过程以及 JTM 的代码实现论文笔记:Learning Optimal Tree Models under Beam Search 此链接尚未更新背景在第一篇论文中提出的基于树结构的召回模型,优化树结构 T原创 2021-04-11 18:09:35 · 1220 阅读 · 2 评论 -
基于树的召回框架(一):Learning Tree-based Deep Model for Recommender Systems
背景在召回阶段,如果需做全量召回,直接线性遍历每个物品的时间复杂度是 O(N)O(N)O(N),如果 NNN 过大,会遇到严重的计算效率过低的问题。在面对大规模物品集时,经典的召回思路有两种:基于物品的协同过滤、内积模型向量检索。基于物品的协同过滤使用 item-based 的协同过滤方法进行物品召回,可以有效降低计算量。其基于两阶段的思路,首先根据用户的历史行为(点击、购买等)获得触发物品(Trigger Item),然后到物品集中检索与这些触发物品最相似的物品,其中物品对的相似度是离线就已经预先计原创 2021-04-06 16:59:47 · 960 阅读 · 1 评论 -
DCN的Cross操作的优缺点
DCN全称Deep Crossing Network,模型介绍可以见 这篇文章DCN的关键设计在于Cross层,假设输入为特征向量 x0x_0x0,其每一层的运算过程为 :xi+1=x0xiTwi+1+xix_{i+1}=x_0x_{i}^Tw_{i+1}+x_ixi+1=x0xiTwi+1+xi可视化为:前面的文章详细推导了为什么有 iii 层的Cross操作可以得到从 1 阶到 i+1i+1i+1 阶的任意的特征组合,这里截图放在这里:后来看到xDeepFM的论文,其首先证明了原创 2020-11-19 16:40:50 · 1357 阅读 · 0 评论 -
论文笔记:A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
引言协同过滤模型的一个很大缺陷在于很难处理冷启动问题,基于内容的推荐是一种解决思路,例如对于系统中的新物品,可以将其推荐给喜欢系统中相似物品的用户,对于新用户,可以给其推荐类似的用户所喜欢的物品。这里会涉及一个问题,即如何对用户建模,以计算其之间的相似度。不少相关文献已经尝试过使用用户的搜索记录或社交帖子等数据作为对用户建模的原始数据,本文就是采用用户的搜索记录作为用户建模的数据的。跨域推荐也是一种缓解冷启动问题的思路,其基本假设是:在同一个领域具有相似品位的用户在另一个领域也具有类似品位。跨域推原创 2020-11-18 23:12:47 · 890 阅读 · 0 评论 -
论文笔记:Neural Collaborative Filtering 以及 Neural Collaborative Ranking
简介本论文提出了NCF(Neural Collaborative Filtering),使用神经网络来解决协同过滤的问题。文章论证了传统的矩阵分解(协同过滤的一种常见实现)可以看做是NCF模型的一个特例,并通过实验论证了NCF相对于之前模型的优越性。关于矩阵分解,推荐阅读文章 推荐算法之矩阵分解预备知识一、显式反馈与隐式反馈显式反馈一般指评分、评论等能直接反映用户对物品兴趣程度的反馈,隐式反馈是指浏览等行为,其无法准确反应用户是否喜欢该item(不过浏览时间的长短可以间接反映兴趣程度)使用隐原创 2020-11-17 17:29:40 · 419 阅读 · 1 评论 -
论文笔记:Collaborative Filtering Recommender Systems
学习随笔,仅记录值得留意的点。协同过滤的适用领域PS:适用协同过滤的场景并不一定完全符合下述要求,只是如果下述条件符合会更适合使用CF数据要求1、item数量足够多2、每个item有足够多的评分3、每个用户对较多数量的item给出了评分。如果一个用户只对一个item进行了评分,那我们就无法获得item之间相关联的信息。4、用户评分的数量要比item数量大得多。例如当用户评论稀疏时,我们就需要更多用户来弥补这一缺陷;再举个实际例子,谷歌搜索所索引了的网页数量比全球人口还要多,因此用户无法对ite原创 2020-11-15 20:47:03 · 871 阅读 · 0 评论