推荐算法
文章平均质量分 85
CC‘s World
这个作者很懒,什么都没留下…
展开
-
【推荐算法】深度学习推荐算法综述 Deep Learning based Recommender System: A Survey and New Perspectives
深度学习推荐算法综述推荐算法综述MLPCNNRNN推荐算法论文深度学习原创 2022-01-12 16:20:04 · 7163 阅读 · 0 评论 -
【推荐算法】协同过滤推荐算法综述 & 传统推荐算法综述
协同过滤算法综述 & 传统推荐算法综述协同过滤矩阵分解因子分解机GBDT逻辑回归原创 2021-12-26 13:32:42 · 3359 阅读 · 0 评论 -
【推荐算法论文阅读】Airbnb基于embedding的实时搜索推荐系统Real-time Personalization using Embeddings for Search Ranking at
一、背景Airbnb的搜索团队基于他们的业务场景,基于embedding构建了实时搜索推荐系统。具体到embedding方法上,Airbnb生成了两种不同的embedding,分别对用户的“短期”和“长期”兴趣进行编码。其中生成短期兴趣embedding的目的是进行房源的相似性推荐,以及对用户进行session内的实时个性化推荐。生成长期兴趣embedding的目的是在嘴中的推荐结果中照顾到用户之前的预定偏好,推荐更容易被用户预订的个性化房源。二、基于短期兴趣的房源embedding方法Airbnb原创 2022-04-26 17:40:18 · 570 阅读 · 0 评论 -
【推荐算法论文阅读】RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems
一、背景为了解决协同过滤的稀疏性和冷启动问题,研究人员通常利用诸如社交网络或项目属性等辅助信息来提高推荐性能。 本文将知识图谱视为边信息的来源。 为了解决现有的基于嵌入和基于路径的知识图感知推荐方法的局限性,我们提出了 RippleNet,这是一个端到端的框架,可以自然地将知识图合并到推荐系统中。类似于在水面上传播的实际涟漪,RippleNet 通过沿知识图谱中的链接自动且迭代地扩展用户的潜在兴趣来刺激用户偏好在知识实体集上的传播。 由用户历史点击项目激活的多个“涟漪”因此叠加形成用户对候选项目的偏好分布原创 2022-04-25 20:35:15 · 1154 阅读 · 0 评论 -
【推荐算法论文阅读】Collaborative Memory Network for Recommendation Systems
一、简介本文提出协同记忆网络这一深层结构:它是一种将基于潜在因素模型的全局结构和基于邻域的局部结构,用非线性方法进行统一实现的深度结构模型。在Memory Networks的成功推动下,我们将记忆组件和神经注意机制融合为邻域组件,记忆模块中用户和物品记忆的关联寻址方案将复杂的用户-物品关系与神经注意机制结合起来编码,以学习用户-物品特定的邻域。最终,输出模块联合利用了存有用户-物品记忆的邻域来生成排序分数。集成多个记忆模块作为一个深度结构可以捕捉更加复杂的用户-物品关系。在信息过载的时代,推荐系统显得十原创 2022-04-20 22:13:30 · 659 阅读 · 0 评论 -
【推荐算法论文阅读】Deep Matrix Factorization Models for Recommender Systems∗
简介这是一篇很简单的论文,论文说仅对观察到的评分进行建模不足以做出良好的 top-N 推荐。 隐式反馈,例如购买历史和未观察到的评级,应用于推荐系统会更好。但是其实,作者所说的隐式反馈就是那些user未评分item的rating设置为0.然后本文提出了两个亮点:我们首先构建了一个包含显式评分和非偏好隐式反馈的用户项目矩阵,这与仅使用显式评分或仅使用隐式评分的其他相关方法不同。 以这个完整的矩阵(显式评分和零隐式反馈)作为输入,提出了一种神经网络架构来学习一个通用的潜在低维空间来表示用户和项目。(其实原创 2022-04-20 18:03:08 · 864 阅读 · 0 评论 -
【推荐算法论文阅读】ATRank: An Attention-Based User Behavior Modeling Framework for Recommendation
一、背景本文提出一种基于注意力机制的用户异构行为序列的建模框架,并将其应用到推荐场景中。我们将不同种类的用户行为序列进行分组编码,并映射到不同子空间中。我们利用 self-attention 对行为间的互相影响进行建模。最终我们得到用户的行为表征,下游任务就可以使用基本的注意力模型进行有更具指向性的决策。我们尝试用同一种模型同时预测多种类型的用户行为,使其达到多个单独模型预测单类型行为的效果。亮点:这是阿里巴巴和北大联合发表的一篇论文,在电商环境中,用户会存在多种行为:浏览、购买、收藏商品,领取、使原创 2022-04-20 15:36:19 · 1173 阅读 · 2 评论 -
【推荐算法论文阅读】STAMP: Short-Term Attention/Memory Priority Model for Session-based Recommendation
这是一篇很好理解的论文,论文提出:现有的方法都没有明确考虑用户当前行为对其下一步行动的影响。 在这项研究中,我们认为长期记忆模型可能不足以对通常包含由意外点击引起的用户兴趣漂移的长时间会话进行建模。 提出了一种新颖的短期注意力/记忆优先模型作为补救措施,该模型能够从会话上下文的长期记忆中捕获用户的一般兴趣,同时从短期记忆中考虑用户当前的兴趣。根据现有文献,几乎所有基于 RNN 的 SRS 模型都只考虑将会话建模为一系列项目,而没有明确考虑用户的兴趣随时间漂移,这在实践中可能存在问题。例如,如果某个特定的数原创 2022-04-18 19:10:58 · 996 阅读 · 0 评论 -
【推荐算法论文阅读】Next Item Recommendation with Self-Attention
本文的亮点在于将item之间的短期交互用Transformer框架的self-attention建模,并将item和user之间的长期交互用一种类似于latent factor的方法建模(latent factor是user embedding和item embedding之间的点积,本文为了避免metric learning存在的不等式问题,将点积换成了欧式距离)。一、item之间的短期交互建模用Transformer架构的self-attention机制进行建模输入是:然后进行self-att原创 2022-04-18 16:36:55 · 1103 阅读 · 0 评论 -
【推荐算法论文阅读】A Simple Convolutional Generative Network for Next Item Recommendation
这篇文章主要是与Caser进行对比,设计了NextItNet模型,它借鉴pixelCNN的思想,采用层叠的1维空洞卷积扩大感受野来提取item序列特征,加入了残差学习的机制以防止梯度消失的问题,并且为了减少模型中的参数,使用了1*1卷积核进行降维和升维操作。解决的问题:基于RNN的序列推荐模型,通常依赖于整个过去的隐藏状态,不能充分利用序列进行并行计算,因此模型的速度在训练和评估中受到了限制。Caser的局限性:(1)对长序列数据建模时,使用max pooling不能确定重要特征出现的次数(可能有多原创 2022-04-14 14:44:08 · 1068 阅读 · 0 评论 -
【推荐算法论文阅读】Recurrent Neural Networks with Top-k Gains for Session-based Recommendations
本文是一篇很好的讲述进行梯度下降和参数更新时,困难样本、简单样本与梯度消失之间的关系,以及如何设置使简单样本对平均梯度的影响更小。一、sampling the output在每个训练步骤中,GRU4Rec 将会话中当前事件的项目(由 one-hot 向量表示)作为输入。 网络的输出是项目的一组分数,对应于它们成为会话中下一个项目的可能性。GRU4Rec 引入了基于mini-batch的采样。 对于mini-batch中的每个example,相同mini-batch的其他examples作为负样本。原创 2022-03-21 14:49:20 · 1683 阅读 · 0 评论 -
【推荐算法】排序学习
传统的检索模型靠人工来拟合排序公式,并通过不断地实验确定最佳的参数组合,以此构成相关性打分函数。机器学习排序与传统的检索模型不同,可通过机器学习获得最合理的排序公式,而人只需要给机器学习提供训练数据。可以将机器学习排序方法分为以下三种:单文档方法(Pointwise): 处理对象是单一文档,将文档转化成特征向量后,将排序问题转化为机器学习中常规的分类或回归问题。CTR方法是单文档方法的典型应用,相对比较成熟,广泛用于广告、搜索、推荐中。CTR方法的数学表达式:y=f(x)y=f(x)y=f(x),其中原创 2022-03-21 13:29:23 · 1538 阅读 · 0 评论 -
【推荐算法论文阅读】LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation
这篇文章是基于NGCF提出的改进,NGCF相关的工作参考【推荐算法论文阅读】Neural Graph Collaborative Filtering一、背景通过严格的对照实验(在相同的数据集和评估指标上),我们得出结论,从 GCN 继承的两个操作——特征转换和非线性激活——对 NGCF 的有效性没有任何贡献。 更令人惊讶的是,删除它们会显着提高准确性。 这反映了在图神经网络中添加对目标任务无用的操作的问题,这不仅没有带来任何好处,反而降低了模型的有效性。 受这些实证发现的启发,我们提出了一个名为 Lig原创 2022-03-17 21:06:44 · 970 阅读 · 0 评论 -
【推荐算法论文阅读】Neural Graph Collaborative Filtering
一、背景协同过滤学习模型从项目的丰富侧面信息中学习的深层表示来扩展MF嵌入功能;神经协同过滤模型则用非线性神经网络取代内积的MF交互函数。以上的方法都是有效的,但是却无法为CF提供合适的嵌入,这是因为缺少一个协同信号(它潜伏在用户与项目之间的交互中,以揭示用户(或项目)之间的行为相似性。)更具体的是,现有的大多数方法只使用描述性的特性(例如id和属性)构建嵌入功能,而不考虑用户-项目的交互,这些功能只用于定义模型训练的目标函数。因此必须依赖交互功能弥补次优嵌入的不足。虽然直接地使用交互功能能弥补次优嵌入原创 2022-03-17 20:32:22 · 2035 阅读 · 0 评论 -
【推荐算法代码实现】Deep Interest Network for Click-Through Rate Prediction代码实现和解读
论文解读见【推荐算法】深度学习推荐算法综述 Deep Learning based Recommender System: A Survey and New Perspectives第6.2小节。一、数据处理1.1 基础数据论文中用的是Amazon Product Data数据,包含两个文件:reviews_Electronics_5.json, meta_Electronics.json下载并解压:wget -c http://snap.stanford.edu/data/amazon/prod原创 2022-03-13 16:55:45 · 2898 阅读 · 1 评论 -
【推荐算法论文阅读】Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations
一、背景工业界现有的推荐系统都需要从一个超大规模的候选集中拉取item进行打分排序。解决数据稀疏和指数级候选集分布的一种通常做法是从item的内容特征中学习出item的稠密表示。这里很自然地就想到了工业界大名鼎鼎且应用广泛的双塔神经网络结构,其中的一塔就是从丰富的item内容特征中学习到item的表示。工业界目前训练双塔结构一般是通过随机mini-batch的方式来优化损失函数。这种训练方式存在的一个显著问题就是in-batch loss会因为随机采样偏差而导致模型效果不好,尤其是当样本分布出现明显倾斜原创 2022-03-12 20:06:11 · 2010 阅读 · 0 评论 -
【推荐算法论文阅读】Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts
一、背景如果做过推荐系统,就会发现在想要达成某些目标的时候,非得多任务一起上不可。就拿给用户推荐视频为例,我们既希望提高用户的点击率,同时也希望提高视频的播放时长,视频点赞、转发等等… 这些目标的达成并非是简单的相辅相成,更多的可能是相互竞争的关系。要是我们只让模型学习点击率,那么经过训练的模型推荐结果很可能导致标题党和封面党大行其道,真正的好的视频却被雪藏了,这显然不是我们希望看到的。而如果一味的追求高点赞,也可能就忽略了一些相对冷门的或新的佳作。这种对立,对于某些互联网巨头的黄赌毒APP来说尤为严重,原创 2022-03-09 20:00:08 · 524 阅读 · 0 评论 -
【推荐算法论文阅读】Perceive Your Users in Depth: Learning Universal User Representations from Multiple EC
一、亮点本文的主要亮点是多场景协同学习用户表示的实现过程。本文提出了一个基于多场景任务的用户表示学习方法,可以得到更有效的个性化表示。用户的各种行为(点击、加标签、购买等)通过将内容、行为和上线文信息使用LSTM和attention构造,多个任务并行训练,共同更新用户表示。生成的用户表示还可以迁移到其他应用场景。二、系统架构三、模型结构用户行为序列作为输入送入embedding层,上层加入LSTM和attention之后,得到用户的表示向量。可以看出来,用户的表示向量是用128维的用户特征与12原创 2022-02-16 19:38:24 · 793 阅读 · 0 评论 -
【推荐算法论文阅读】BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Trans
一、背景之前基于RNN的推荐模型都是按照从左到右单向建模的,单向结构限制了用户行为序列中隐藏表示的能力——它们通常假定一个严格有序的序列,而这并不总是实用的。本文提出了 bert4rec,应用deep biderectional self-attention 来对用户的行为序列进行建模的。为了避免信息泄露,高效的训练双向模型,我们采用Cloze目标来进行顺序推荐,预测序列中的随机mask项,通过对其上下文的联合条件进行预测序列中随机mask的items。二、Bert4Rec1. 问题定义U={u1原创 2022-01-25 19:03:54 · 1960 阅读 · 0 评论 -
【推荐算法论文阅读】Learning Deep Structured Semantic Models for Web Search using Clickthrough Data
一、亮点DSSM是Deep Structured Semantic Model的缩写,即我们通常说的基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。为了处理大型词汇表,提出了word hashing方法,query或document的高维term向量被投影到低维的基于n-gram的向量,而信息损失很小。二、模型结构DNN的输入是一个高维的term向量(例如,qu原创 2022-01-25 14:41:25 · 681 阅读 · 0 评论 -
【推荐算法论文阅读】Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
一、背景在天猫的个性化推荐场景中,无论是召回还是排序阶段,最重要的都是为用户兴趣建模。然而建模用户兴趣存在问题:一个用户可能对多种物品感兴趣。现有的推荐算法采取过多种方法来对用户兴趣建模。基于协同过滤的方法用用户历史行为或隐性因子来表示用户兴趣,这种方法的局限性在于稀疏性和计算困难。深度学习方法通常将用户兴趣表示为一个低维度的embedding,然而这种方法中,embedding的维度可能会成为表达用户各种兴趣的瓶颈。DIN在表示用户兴趣时引入了attention,然而由于计算复杂性,这种方法只能用在排原创 2022-01-24 20:05:26 · 510 阅读 · 0 评论 -
【推荐算法论文阅读】Item2Vec: Neural Item Embedding for Collaborative Filtering
由于 Word2vec 的流行,越来越多的 Embedding 方法可以被直接用于物品 Embedding 向量的生成,而用户 Embedding 向量则更多通过行为历史中的物品 Embedding 平均或者聚类得到。利用用户向量和物品向量的相似性,可以直接在推荐系统的召回层快速得到候选集合,或在排序层直接用于最终推荐列表的排序。正是基于这样的技术背景,微软于 2016 年提出了计算物品 Embedding 向量的方法 Item2vec。相比 Word2vec 利用 “词序列” 生成词 Embedding原创 2022-01-24 13:37:35 · 946 阅读 · 0 评论 -
【推荐算法】推荐系统必读论文整理
CIKM 2021 | 推荐系统相关论文分类整理 https://zhuanlan.zhihu.com/p/422776844推荐算法最前沿|CIKM2020推荐系统论文一览 https://blog.csdn.net/abcdefg90876/article/details/109040152推荐算法最前沿|KDD2020推荐系统论文一览 https://blog.csdn.net/abcdefg90876/article/details/109088835KDD 2021 | 推荐系统论文集锦[原创 2022-01-20 18:55:25 · 2262 阅读 · 0 评论 -
【推荐算法】推荐系统的评估
一、离线评估的主要方法1. Holdout检验Holdout检验是基础的离线评估方法,它将原始的样本集合随机划分为训练集和验证集两部分,比如70%训练集,30%测试集(但现在很多机器学习框架、深度学习框架中都增加了验证集,即将整个数据集分成三份,70%训练集,10%验证集,20%测试集)。Holdout检验的缺点也很明显,即在验证集上计算出来的评估指标与训练集和测试机的划分有直接关系,如果仅进行少量Holdout检验,则得到的结论存在很大的随机性(在划分数据集的时候尽量保证其随机性)。2. 交叉检验原创 2022-01-20 15:47:18 · 2341 阅读 · 0 评论 -
【推荐算法】冷启动
具体地讲,根据数据匮乏情况的不同,冷启动问题主要分为 3 类:用户冷启动:新用户注册后,没有历史行为数据。物品冷启动:新物品上架后,没有用户对该物品的交互数据。主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。系统冷启动:新系统上线时,缺乏所有历史相关数据。如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。可以把主流的冷启动策略归纳为以下三类:基于规则的冷启动过程;丰富冷启动过程中可原创 2022-01-20 13:48:02 · 2449 阅读 · 0 评论 -
【推荐算法】探索与利用
“探索与利用”机制是在“探索新数据”和“利用旧数据”之间进行平衡,使系统既能够利用旧数据进行推荐,达到推荐系统的商业目标,又能高效地探索冷启动的物品是否是“优质”物品,使得冷启动物品获得曝光的倾向,快速收集冷启动数据。解决“探索与利用”主要有三大类方法:传统的探索与利用方法:主要有ε-greedy、汤普森采样和UCB(Upper Confidence Bound,置信区间上界)。该类解决方法着重解决新物品的探索和利用,方法中并不考虑用户、上下文等因素,因此是非个性化的探索与利用方法。个性化的探索与利原创 2022-01-20 13:47:29 · 1540 阅读 · 0 评论 -
【推荐算法】推荐算法的实时性
从机器学习的角度讲,推荐系统的实时性的重要之处体现在以下两个方面:推荐系统更新的越快,说明最近用户兴趣更新的越快,越能为用户进行有效推荐;推荐系统更新的越快,模型越容易捕捉最新流行的数据模式,进行流行推荐。这两方面的原因直接对应着推荐系统实时性的两大要素:特征 的实时性和 模型 的实时性。一、推荐系统“特征”的实时性1. 客户端实时特征客户端是最接近用户的环节,也是能够实时收集用户会话内行为及所有上下文特征的地方,在经典的推荐系统中,利用客户端收集时间、地点、推荐场景等上下文特征,然后让这些原创 2022-01-20 12:35:28 · 2643 阅读 · 0 评论 -
【推荐算法】局部敏感哈希——让embedding插上翅膀的快速搜索方法
Embedding 最重要的用法之一是作为推荐系统的召回层,解决相似物品的召回问题。在实际工程中, 能否应用 Embedding 的关键就在于能否使用 Embedding 技术 “快速” 处理几十万甚至上百万候选集, 避免增大整个推荐系统的响应延迟。传统的 Embedding 相似度的计算方法是 Embedding 向量间的内积运算,这就意味着为了筛选某个用户的候选物品,需要对候选集合中的所有物品进行遍历。在 k 维的 Embedding 空间中,物品总数为 n ,那么遍历计算用户和物品向量相似度的时间复原创 2022-01-20 11:29:48 · 880 阅读 · 0 评论 -
【推荐算法】Graph Embedding——引入更多结构信息的图嵌入技术
在互联网背景下,数据对象之间更多的是以图结构的方式呈现的,典型的例子就是由用户行为序列产生的物品关系图,以及由属性和实体之间组成的知识图谱(knowledge graph)。在面对图结构时候,传统的序列embedding方法就显得力不从心了,因此graph embedding 就成了最新的研究方向。graph embedding是一种对图结构中的节点进行embedding编码的方法,最终生成的节点Embedding 向量一般包含图的结构信息和邻近节点的局部相似性信息。一、Deep Walk—最早最基础原创 2022-01-20 11:17:01 · 1326 阅读 · 0 评论 -
【推荐算法论文阅读】Graph Convolutional Neural Networks for Web-Scale Recommender Systems
一、背景扩展 GCN 很困难,因为很多在大数据环境中,很多基于这些 GCN 设计的假设都不成立了。比如,所有的基于 GCN 的推荐系统需要在训练时使用图的拉普拉斯矩阵,但是当顶点数很大的时候,这就不现实了,因为算不出来。所以本文提出了一种在 Pinterest 上的大规模深度推荐引擎,开发了一种高效的图卷积算法 PinSage,融合了随机游走和图卷积,来生成顶点(物品)的表示,同时整合了顶点信息和图结构。二、模型结构本文方法的计算关键在于局部图卷积的表示(notion)。我们使用多个卷积模块来聚合一原创 2022-01-19 19:04:07 · 1390 阅读 · 4 评论 -
【工业界推荐算法】Embedding-based News Recommendation for Millions of Users
一、概述本文提出了一个三层的基于embedding的分布式表示方法:基于一种弱监督的降噪自编码器对文章进行embedding向量化;利用用户的历史浏览信息作为rnn的训练数据生成用户的embedding向量;直接利用文章embedding向量和用户的embedding向量做内积,匹配出用户最可能感兴趣的topN文章列表,并对该列表做去重。日本雅虎团队将该推荐策略应用在来日本雅虎的智能手机主页推荐业务上。整个流程分为五部分:识别:获得预先根据用户历史数据计算好的用户特征匹配:使用用户特征从原创 2022-01-16 22:49:18 · 657 阅读 · 0 评论 -
【工业界推荐算法】Entire Space Multi-Task Model: An Approach for Estimating Post-Click Conversion Rate
一、背景本文是阿里的一篇对于cvr(转化率)预测建模时遇到的两个主要问题给出了相应的解决方案。论文中解决了两个问题:样本选择偏差(Sample Selection Bias,SSB): 传统的cvr模型训练的时候用的是被点击的曝光数据(clicked impressions),而预测的时候却是针对曝光的数据(impressions),即:传统cvr模型训练样本(点击->转化),线上预测时时 (曝光->转化)。训练使用的数据只是预测数据的一部分,这种数据分布不一致会影响模型的泛化能力。训练原创 2022-01-16 18:49:20 · 937 阅读 · 0 评论 -
【工业界推荐算法】Deep Neural Networks for YouTube Recommendations
一、总体框架在推荐系统领域,特别是YouTube的所在视频推荐领域,主要面临三个挑战:规模大、更新快(平衡新内容和已有的视频可以从探索与利用的角度来解)、有噪音。本文和工业界经典的推荐流程一样,系统分为候选集生成(也称为搜索或召回Matching)、排序(Ranking)两个阶段,这两个阶段分别使用了一个深度神经网络。Matching阶段通过i2i/u2i/u2u/user profile等方式“粗糙”的召回候选商品,Matching阶段视频的数量是百级别了;Ranking阶段对Matching后的视频原创 2022-01-14 19:16:33 · 805 阅读 · 0 评论 -
【推荐算法论文阅读】Wide & Deep Learning for Recommender Systems
Wide部分主要作用是让模型具备较强的“记忆能力”;Deep部分的主要作用是让模型具有“泛化能力”。正是这样的结构特点,使模型兼具了逻辑回归和深度神经网络的优点——能够快速处理并记忆大量历史行为特征,并且具有强大的表达能力。“记忆能力”:模型直接学习并利用历史数据中的物品或者强特征的“共现频率”的能力。一般来说,协同过滤、逻辑回归等简单模型具有较强的“记忆能力”。这类模型结构简单,没有过多的特征交叉,原始数据往往可以直接影响推荐结果,产生类似于”若点击过A则推荐B“这类规则式的推荐,相当于模型直接记住了原创 2022-01-12 19:10:04 · 297 阅读 · 0 评论 -
【推荐算法论文阅读】Recurrent Recommender Networks
一、背景推荐系统传统的解决方案对数据的时间效应和因果属性缺乏处理,典型情景如:用户对电影的看法是随时间变化的,这种变化会使得一些垃圾电影变为流行电影季节时令性:浪漫喜剧,圣诞电影,夏日大片等类型的movie的季节性尤其突出。用户兴趣:这个变化因素就更多了,通常很难显式建模。二、亮点使用两个LSTM网络来建模动态的user state和item state同时,考虑到用户长期兴趣和item静态特征等固定属性,还使用矩阵分解建模用户和item的静态潜在属性由于每个评分rijr_{ij}ri原创 2022-01-07 14:44:49 · 781 阅读 · 0 评论 -
【推荐算法论文阅读】Contextual Sequence Modeling for Recommendation with Recurrent Neural Networks
一、背景当前的RNN建模方法仅通过考虑用户在过去与之交互的item序列来总结用户状态,而不考虑其他必要类型的上下文信息,例如相关的user-item交互类型,事件之间的时间间隔和每个交互的时间间隔。如:在过去item ID的相同序列上,事件类型的差异导致最有可能的下一个item出现较大差异。最上面的未标记序列代表表示标准RNN可用的信息,导致下面两种可能结果之间的平均预测。在下面的标记序列中,我们观察到用户在上一次活动中购买了手机,因此最有可能访问的下一个项目是补充item,如耳机。在底部标记的序列中原创 2022-01-06 19:48:22 · 626 阅读 · 0 评论 -
【推荐算法论文阅读】Session-based recommendations with recurrent neural networks
一、背景基于会话的推荐方法,主要有基于物品的协同过滤和基于马尔可夫决策过程的方法。基于物品的协同过滤,需要维护一张物品的相似度矩阵,当用户在一个session中点击了某一个物品时,基于相似度矩阵得到相似的物品推荐给用户。这种方法简单有效,并被广泛应用,但是这种方法只把用户上一次的点击考虑进去,而没有把前面多次的点击都考虑进去。基于马尔可夫决策过程的推荐方法,也就是强化学习方法,其主要学习的是状态转移概率,即点击了物品A之后,下一次点击的物品是B的概率,并基于这个状态转移概率进行推荐。这样的缺陷主要是随原创 2022-01-06 15:52:38 · 1286 阅读 · 0 评论 -
【推荐算法论文阅读】Hashtag Recommendation Using Attention-Based Convolutional Neural Network
一、背景在微博上,用户用有限数量的字去记录生活或者表达感情。因此,微博被广泛用于舆情分析,预测等许多其他的应用。微博包含一种元数据标签形式(metadata tag, hashtag),hashtag是一串前缀为#的字符串。在微博内,Hashtags被当做关键字或者话题,有着广泛的应用,比如微博检索(microblog retrieval),查询展开(query expansion),情感分析(sentiment analysis)。可是,只有很少的用户才会为微博打上hashtags,因此,自动推荐ha原创 2022-01-04 21:07:05 · 874 阅读 · 0 评论 -
【推荐算法论文阅读】Collaborative Filtering with Stacked Denoising AutoEncoders and Sparse Inputs
一、亮点使用自编码器利用sparse rating matrix重建dense rating matrix;使用降噪自编码器,通过引入高斯噪声/masking noise/椒盐噪声来提高鲁棒性;巧妙地通过损失函数的设计来平衡去噪和重构的损失二、损失函数损失函数设计如下:它基于两个主要的超参数 α、β,平衡了网络是专注于去噪输入还是重建输入。...原创 2022-01-01 19:19:06 · 572 阅读 · 1 评论 -
【推荐算法】CCCFNet: A Content-Boosted Collaborative Filtering Neural Network for Cross Domain Recommender
一、亮点使用因子分解的框架,将协同过滤和基于内容的过滤结合在一起;使用Cross Domain跨领域推荐——假设跨领域存在一些一致的模式(如不同的domain共享user-side sub-network),因此可以从相对密集的辅助领域获取知识。二、模型具体结构rating matrix 定义为:item content attribute matrix定义为:A(1)和R(1)代表target domain的矩阵,A(2)和R(2)代表auxiliary domain的。为了融合it原创 2021-12-30 18:59:23 · 593 阅读 · 0 评论