(论文阅读笔记)Deep Learning based Recommender System: A Survey and New Perspectives

为了交英语作业机翻了这篇论文的一些部分 ,由于时间有限,感兴趣的内容有时间再翻





深度学习在推荐系统中的应用和发展:在工业界,推荐系统是很重要的,在很多在线网站和移动应用上可以极大的提升用户体验并且提高产品或服务的销量[20, 27, 30, 43, 113],例如在NetFlix上80%的电影点播来自于推荐系统[43],在YouTube上60%的视频点击来自于推荐系统[30]。最近,很多公司都应用深度学习来进一步提升推荐系统的性能[20,27,113]。Covington 等人[27]为YouTube提出了基于深度学习的视频推荐算法,Cheng 等人[20]为GooglePlay提出了使用wide&deep模型的App应用推荐系统, Shumpei等人[113] 为YahooNews提出了一种基于RNN的新闻推荐系统,所有这些模型都通过了在线测试并且相对于传统模型都有极大的提升。因此,深度学习在工业推荐中引发了深刻的革命。




  1. 我们系统性的总结了基于深度学习技术的推荐模型并且提出了分类方案
  2. 我们回顾和总结了先进技术
  3. 我们讨论了挑战和开放性问题,并且基于以往的推荐系统工作者的研究对提出了未来该领域的新的趋势和未来的研究方向





2.2深度学习技术深度学习通常被认为是机器学习的子领域。 深度学习的典型定义的本质是它能够学习深层表示,即从数据中学习多层次的表示和抽象。 出于实际原因,我们将任何神经可微分结构视为“深度学习”,只要它使用随机梯度下降(SGD)的变体优化可微分目标函数。 神经结构在监督和非监督学习任务中都取得了巨大的成功[31]。

2.3为什么将深度学习应用到推荐系统在深入了解最新进展的细节之前,先了解为何要将深度学习技术应用于推荐系统的原因是有好处的。很明显,在短短几年内已经提出了许多深度推荐系统模型。这个领域确实充满了创新。在这一点上,很容易对这么多不同架构的需求和神经网络对问题领域的效用产生质疑。沿着相同的思路,很容易提供一个明确的理由来说明为什么提出每种架构和它最有效的使用场景。总而言之,这个问题与任务,域和推荐场景密切 相关。神经结构最吸引人的特性是可以(1)端到端可微分和(2)提供适合输入数据类型的合适的归纳偏差。因此,如果模型可以利用固有结构,那么深度神经网络应该是有用的。例如,CNN和RNN长期利用视觉(和/或人类语言)中的内在结构。类似地,会话或点击日志的顺序结构非常适合于循环/卷积模型提供的归纳偏差[56,143,175]。

此外,深层神经网络也可以是多个神经结构块意义上的复合组成一个(巨大的)可变分函数并进行端到端训练。这在处理基于内容的推荐时是非常具有优势的。在对Web上的用户/项目建模时,多模态数据是非常常见且不可避免的。例如,当处理文本数据(评论[202],推文[44]等),图像数据(社交帖子,产品图像),CNN / RNN成为不可或缺的神经结构块。这里,传统的替代方案(设计模块特定特征等)变得非常不具吸引力,因此,推荐系统不能利用联合(端到端)表示学习。从某种意义上说,推荐系统领域的发展也与相关模式(如视觉或语言社区)的进步研究紧密结合。例如,为了处理评论,人们将不得不执行昂贵的预处理(例如,关键短语提取,主题建模等),而新的基于深度学习的方法能够端到端地摄取所有文本信息[202]。总之,深度学习能力可以在这些领域中被当作范式,如果没有这些最新进展,在统一的联合框架[197]中表达图像,文本和交互的能力是不可能的。

相对于仅交互设置(即矩阵完成或协作排序问题),当存在大量复杂性或存在大量训练实例时,使用深度神经网络是合理的。在[53]中,作者使用MLP来近似交互函数,并且与MF等传统方法相比,表现出了合理的性能提升。虽然这些神经模型的表现更好,但我们也注意到,当使用仅基于动量的梯度下降训练时,BPR,MF和CML等标准机器学习模型的表现相当不错[145]。然而,我们也可以将这些模型视为神经结构,因为它们利用了最近的深度学习研究进展,例如Adam,Dropout或Batch Normalization [53,195]。同样很容易看出,传统的推荐算法(矩阵分解,矩阵分解等)也可以表示为神经/可微分结构[53,54],并通过Tensorflow或Pytorch等框架进行有效训练,从而实现高效的GPU训练和自动微分。因此,在当今的研究环境(甚至是工业)中,完全没有理由不使用基于深度学习的工具来开发任何推荐系统。









CNN用于图像特征提取。王等人 [165]研究了视觉特征对兴趣点(POI)推荐的影响,并提出了视觉内容增强的POI推荐系统(VPOI)。 VPOI采用CNN来提取图像特征。推荐模型建立在PMF之上,用来探索以下因素之间的相互作用:(1)视觉内容和潜在用户因素; (2)视觉内容和潜在位置因素。楚等人 [25]利用餐馆推荐中的视觉信息(例如餐馆的食物和家具的图像)的有效性联合 CNN提取的视觉特征与文本表示一起输入到MF,BPRMF和FM中以测试它们的性能。结果表明,视觉信息在一定程度上改善了性能,但并不显著。He等人 [50]通过将视觉特征(通过CNN学习到的)结合到矩阵分解中,设计了视觉贝叶斯个性化排序(VBPR)算法。He等人 [49]扩展了VBPR,探索用户的时尚意识和用户在选择项目时考虑的视觉因素的演变。 Yu等人 [191]提出了一种基于美学的服装推荐的耦合矩阵和张量因子分解模型,其中CNN用于学习图像特征和美学特征。 Nguyen等人[110]提出了一种基于CNN的个性化标签推荐模型。它利用卷积和最大池化层从图像块中获取视觉特征。注入用户信息以生成个性化推荐。为了优化该网络,采用BPR目标来最大化相关和不相关标签之间的差异。Lei等人 [84]提出了一个具有CNN的比较深度倾斜模型用于图像推荐。该网络包括两个用于图像表示学习的CNN和一个用于用户偏好建模的MLP。它将两个图像(一个正图像用户喜欢,一个负图像用户不喜欢)与用户进行比较。训练数据由三元组组成:t(用户Ut,正图像I + t,负图像I-t)。假设用户与正像D(π(Ut),φ(I + t))之间的距离应该更接近用户与负像之间的距离D(π(Ut),φ(I-t)),其中D (·)是距离度量(例如Euclideandistance)。 ConTagNet [118]是一种上下文感知标签推荐系统。图像特征由CNN学习。上下文表示由两层全连接的前馈神经网络处理。将两个神经网络的输出连接起来并送入sostmax函数以预测候选标签的概率。

CNN用于文本特征提取。 DeepCoNN [202]采用两个并行的CNN来模拟评论文本中的用户行为和项目属性。该模型通过利用CNN学习文本的丰富语义表示来缓解稀疏性问题并增强模型可解释性。它利用单词嵌入技术将评论文本映射到低维语义空间,并保留单词序列信息。然后将提取的评论表示连续通过一个具有不同内核的卷积层,一个最大池化层和一个全连接层。最后将用户网络xu和项目网络xi的输出连接为预测层的输入,其中应用矩阵分解以捕获它们的相互作用来进行评级预测。Catherine等人 [11]注意到DeepCoNN只有在目标用户为目标物品编写评论文本的情况下在测试时才能正常工作,这是不合理的。因此,他们通过引入潜在层来表示目标user-target-item对来扩展它。此模型在验证/测试期间不使用评论,并且仍然可以保持良好的准确性。Shen等人 [130]建立了一个电子学习资源推荐模型。它使用CNN从学习资源的文本信息中提取物品特征,例如学习资料的介绍和内容,并按照[153]的相同过程进行推荐。 ConvMF [75]以与CDL类似的方式将CNN与PMF相结合。 CDL使用自动编码器来学习物品特征表示,而ConvMF使用CNN来学习高级物品表示。 ConvMF相对于CDL的主要优点是CNN能够通过字嵌入和卷积内核捕获更准确的物品上下文信息。 Tuan等人 [148]建议使用CNN来学习项目内容信息(例如,名称,描述,标识符和类别)的特征表示,以增强基于会话的推荐的准确性。

基于CNN的协同过滤。 直接将CNN应用于协同过滤也是可行的。 例如,He等人 [51]提出使用CNN来改进NCF并提出了ConvNCF。 它使用外积而不是点积来模拟用户项交互模式。 CNN用于外积的结果可以捕获嵌入维度之间的高阶相关性。 Tang等人 [143]提出了具有CNN的顺序推荐(具有用户标识符)模型,其中两个CNN(分层和垂直)用于对联合级别顺序模式进行建模并且跳过用于序列感知推荐的行为。












一种常见的解释是深度神经网络是高度不可解释的。 因此,提出可解释的建议看起来是一项艰巨的任务。 同样,假设大型复杂的神经模型只是将数据与任何真正的理解相匹配也是很自然的(参见后面关于机器推理的推荐部分)。 这就是为什么这个方向既令人兴奋又至关重要的原因。 可解释的深度学习主要有两种方法。 第一个是对用户做出可解释的预测,让他们了解网络建议背后的因素(即,为什么推荐这个项目/服务?)[126,178]。 第二个方面主要侧重于从业者的解释能力,探究权重和激活函数以更好地了解模型[145]。





多任务学习在许多深度学习任务中取得了成功,从计算机视觉到自然语言处理[26,31]。在所回顾的研究中,一些工作[5,73,87,187]也将多任务学习应用于深度神经框架中的推荐系统,并在单一任务学习方面取得了一些改进。应用基于深度神经网络的多任务学习的优点有三方面:(1)一次学习几个任务可以通过共享隐藏表示来防止过拟合; (2)辅助任务提供可解释的输出以解释推荐; (3)多任务提供隐式数据增强,以减轻稀疏性问题。多任务可以在传统的推荐系统[111]中使用,而深度学习使它们能够以更严格的方式集成。除了引入辅助任务之外,我们还可以为每个特定任务生成跨域推荐的多任务学习,为每个域生成推荐。





在本文中,我们对基于深度学习的推荐系统所做的最值得注意的工作进行了广泛的回顾。 我们提出了一种分类方案,用于组织和聚类现有出版物,并强调了一系列有影响力的研究原型。 我们还讨论了使用深度学习技术进行推荐任务的优缺点。 此外,我们还详细介绍了一些最紧迫的未解决问题和未来的扩展问题。 近几十年来,深度学习和推荐系统都是热门的研究课题。 每年都有大量新的开发技术和新兴模型。 我们希望这项调查能够为读者提供对该领域关键方面的全面理解,澄清最显著的进步,并对未来的研究有所启发。


