摘要:在电商平台中,Review信息对于用户而言是十分有用的,然而,却很少有人对Review的有效性进行研究。本文提出了Neural Attentional Regression model with Review-level Explanations (NARRE) ,在进行评分预测的同时考虑Review的有效性,在Review层面对推荐结果进行解释。
Introduction
评分预测是推荐系统中常见的任务。大多数方法都是基于协同过滤的,例如PMF等,这类方法最大的问题在于无法对推荐提供可解释性。很多研究表明在推荐中提供可解释性,是非常有用的。缺乏可解释性的推荐不能真正让用户信服。在大多数电商网站中,允许用户评论产品并给予评分,用户评论信息中会通常包含关于产品有用的特征,例如quality, material, color 等。在本文中,评论的有效性usefulness of a review 即用户能否根据用户做出是否购买的决定。下图举例说明什么是有效评论和无效评论。
已有研究将用户评论信息整合到隐含因子模型中增强其性能[3, 25–27, 39, 46] 或是生成推荐的解释[11, 32, 44]。尽管取得了较好的成绩,但是却存在两个问题。第一,缺乏评论对被推荐项贡献的建模以及对其他用户有效性;第二,以往研究中的解释通常是对词或短语的抽取,可能会造成评论内容的扭曲。本文是第一个利用评论有效性提升推荐效果和可解释性的工作。
本文提出了Neural Attentional Regression model with Review-level Explanations (NARRE) 模型,模型利用attention机制给每个评论赋予权重。利用用户和被推荐项、还有评论作为多层神经网络的输入,提出了一个权重公式。同时,参考[46]的方法,用两个并列的神经网络学习用户和被推荐项之间的隐含因子特征。其中一个用于建模用户书写评论的倾向,另外一个建模被推荐项目在评论上的倾向。最后一层,我们利用隐含因子模型[21]并将其扩展为一个神经网络作为评分预测的输出。作者在四个真实数据集做了对比实验,发现所提出的方法表现优于当前最好的方法,例如PMF[29], NMF[24], SVD++[20], HFT[27]以及DeepCoNN[46]等。
Related Work
与本文较为相关的最近几篇研究工作也都是将神经网络与协同过滤模型相结合,例如He等[13]提出的Neural Collaborative Filtering (NCF) framework ,建模了用户和被推荐项之间的非线性关系。随后,Neural Factorization Machines(NFM)[12] 利用高阶以及非线性关系扩展了传统的Factorization Machines方法。Collaborative Deep Learning[41] 提出了层次化的贝叶斯模型,基于CNN对用户评论进行建模,并将其与协同过滤结合。DeepCoNN[46] 使用卷积神经网络处理评论,并且将用户和被推荐项目分别并行建模最后用FM结合起来并作评分预测。NRT[25] 将GRU与协同过滤相结合,同时预测评分和生成摘要来模拟用户的感受和反应。当然,上述工作都没有提到评论的可解释性这一问题。
Methodology
- Latent Factor Model: 在隐含因子模型中,任何用户u对项目i的评分都可以用下述公式来建模
- CNN Text Processor : 给定长度为T的输入文本,其中V1:T是它的emebdding 矩阵,那么第j个神经元将其特征抽取如下,其中*表示卷积操作,则是第j个神经元在滑动窗口为t时的结果,然后最终属于这个神经元的特征将通过最大池化操作获得,最大池化的意义是找到最重要的特征,即值最大的那个特征。最后CNN的输出就是由其m个神经元的输出拼接出来的