协同过滤算法_SIGIR 2019 开源论文:基于图神经网络的协同过滤算法

a0f46e3488075b356487b213938a893b.png

本文同步发表在PaperWeekly

张俊:SIGIR 2019 开源论文:基于图神经网络的协同过滤算法​zhuanlan.zhihu.com
3f811e62b993c80ad74789f3c1b3f32d.png

作者丨纪厚业

单位丨北京邮电大学博士生

研究方向丨异质图神经网络,异质图表示学习和推荐系统

3b77e2bf0c729fd0f2da4ce29346e18c.png

论文:https://www.paperweekly.site/papers/3212

源码:xiangwang1223/neural_graph_collaborative_filtering

引言

协同过滤作为一种经典的推荐算法在推荐领域有举足轻重的地位。协同过滤(collaborative filtering)的基本假设是相似的用户会对物品展现出相似的偏好。

总的来说,协同过滤模型主要包含两个关键部分:1)embedding,即如何将 user 和 item 转化为向量表示;2)interaction modeling,即如何基于 user 和 item 的表示来重建它们的历史交互。

传统协同过滤算法(如经典的矩阵分解和神经矩阵分解)本质还是给 user 和 item 初始化一个 embedding,然后利用交互信息来优化模型。它们并没有把交互信息编码进 embedding 中,所以这些 embedding 都是次优的。

直观地理解,如果能将 user-item 的交互信息编码进 embedding 中,将提升 embedding 的表示能力进而提升模型的预测能力。本文的主要创新点在于利用二部图神经网络将 User-Item 的历史交互信息编码进 Embedding 进而提升推荐效果。更重要的是,本文显式地考虑 User-Item 之间的高阶连接性来进一步提升 embedding 的表示能力。

170b62b649963242b042a39db25df542.png

图 1 展示了一个 user-item 的二部图及

的高阶连接性。
的高阶连接性表示
通过长度大于 1 的路径连接到的节点。例如,
通过长度 l=2 的路径连接到
,这代表
的 2 阶连接性;
通过长度 l=3 的路径连接到
,这代表
的 3 阶连接性。需要注意的是,虽然
都是
的 3 阶邻居,但是
可以通过更多的路径连接到
,所以
的相似度更高。

模型

模型主要分为 3 个部分:1)Embedding Layer:将 user 和 item 的 ID 映射为向量表示;2)Embedding Propagation Layers:将初始的 user 和 item 表示基于图神经网络来更新;3)Prediction:基于更新后的 user 和 item 表示来进行预测。模型架构图见 Figure 2。

d41821be8c14c6217271eb565d99728a.png

Embedding Layer

这里对 User 和 Item 分别初始化相应的 Embedding Matrix,然后通过 User 或者 Item 的 ID 进行 Embedding Lookup 将它们映射到一个向量表示。

31c63b7432ee09fd2198ef7e76b8e25f.png

注意,这里初始化的 Embedding 可以认为是 0 阶表示,即:

f5991ed50c03f260e2a2e6b74939980d.png

Embedding Propagation Layers

受 GNN 的 message-passing 架构的启发,NGCF 针对 User-Item 二部交互图设计了 Embedding Propagation 来学习 User 和 Item 的表示。这里作者首先详细的描述了一阶传播,然后泛化到高阶传播。

一阶传播主要包含:消息构建和消息聚合。给定(u,i),从 i 传播到 u 的消息

可以定义为:

316f2a886ed823d940bba3db475e4ac6.png

112b4c5171851eb9e516badbc4a5a45b.png

其中,

都是可学习的参数矩阵,
分别代表 u 和 i 的度。这里
可以理解为归一化系数。

基于上面构建的消息,下一步就是聚合消息来更新节点表示:

338ffc6aefa28e5a748a44a2030e0f6f.png

其中,

代表经过 1 次聚合之后的节点表示。因为单层的消息聚合只能聚合 1 阶邻居的信息,所以这里实际代表了 u 的一阶表示。需要注意的是,这里除了聚合邻居的信息,更重要的是考虑节点自身的信息

高阶传播实际就是将上述的一阶传播堆叠多层。这样经过 l 次聚合,每个节点都会融合其 l 阶邻居的信息,也就得到了节点的 l 阶表示

56a650658ab4d1ec3e3c67073cc670c6.png

Figure 3 清晰地展示了如何在高阶传播中融合高阶邻居的信息。

3e56d70d7174947841ac460f24bde775.png

上面的传播过程也可以写成矩阵的形式,这样在代码实现的时候可以高效的对节点 Embedding 进行更新。

7d98cee6c0144c6d004891f1b4d65f84.png

7e6a1f33cc719c9833f398c44b7c8bf7.png

其中,

是 l 阶的 user 和 item 的表示,
是 user-item 交互矩阵,D 是对角度矩阵。

Model Prediction

模型的预测非常简单,将 L 阶的节点表示分别拼接起来作为最终的节点表示,然后通过内积进行预测。

f11317d9b3d5b3e38802ed160ae2c54f.png

c9d94c02ff76d39c21afb9782c7d0d28.png

实际这里采用了类似 18 ICML Representation Learning on Graphs with Jumping Knowledge Networks 的做法来防止 GNN 中的过平滑问题。GNN 的过平滑问题是指,随着 GNN 层数增加,GNN 所学习的 Embedding 变得没有区分度。过平滑问题与本文要捕获的高阶连接性有一定的冲突,所以这里需要在克服过平滑问题。

最终的损失函数就是经典的 BPR 损失函数:

0c38e7563b876d976c6cd7fc456ea527.png

实验

本文在 Gowalla、Yelp2018 和 Amazon-Book 上进行了大量实验来回答以下 3 个问题:

  • 和 state-of-the-art 的方法相比,NGCF 的效果如何?
  • 模型对于超参数(如模型层数,dropout)的敏感性。
  • 高阶连接性对于模型的影响。

8f7570049f29291cdb2585afef610c85.png

本文的 baseline 主要可以分为两大类:非图神经网络的推荐算法(如 MF 和 CMN)和基于图神经网络的推荐算法(PinSage 和 GC-MC)。实验效果如 Table 2 所示:

7ef10ba74da0a00db2b3ac6ba1b40e4b.png

可以看出,本文所提出的 NGCF 优势很明显,尤其是在 recall 上的提升均超过 10%。同时,作者还对数据进行了稀疏化并进一步验证来说明 NGCF 来稀疏数据上的优势。

601504ebbbc00325f32b7ae702e1063b.png

从 Figure 4 可以看出,NGCF 在数据稀疏度较高的时候有明显优势,随着稀疏度的下降,NGCF 的优势越来越小甚至被 baseline 超过了。

另外,作者验证了模型层数、卷积形式和 dropout 对 NGCF 的影响,具体见 Table 3、Table 4 和 Figure 5。

b0d46ac91e58b61109c20ab7be646c2f.png

81d6b09ec07403e9f110a3331ea4fa16.png

1066c2dc8c242fd163c58b80fde1865e.png

最后,作者研究了高阶连接性对 NGCF 的影响,如 Figure 6 所示。

f5716d68e32cf79edfebc651a131ca87.png

注意这里 MF 可以看做是 NGCF-0。可以看出,随着阶数的增加,相同颜色的节点更好的聚集在一起。也就是说,高阶连接性确实有助于学习 User 和 Item 的 Embedding。

结论

本文提出了基于图神经网络的协同过滤算法 NGCF,它可以显式地将 User-Item 的高阶交互编码进 Embedding 中来提升 Embedding 的表示能力进而提升整个推荐效果。NGCF 的关键就在于 Embedding Propagation Layer 来学习 User 和 Item 的 Embedding,后面的预测部分只是简单的内积。可以说,NGCF 较好地解决了协同过滤算法的第一个核心问题。另外,本文的 Embedding Propagation 实际上没有考虑邻居的重要性,如果可以像 Graph Attention Network 在传播聚合过程中考虑邻居重要性的差异,NGCF 的效果应该可以进一步提升。

参考文献

[1] http://staff.ustc.edu.cn/~hexn/slides/sigir19-ngcf-slides.pdf

[2] https://github.com/xiangwang1223/neural_graph_collaborative_filtering

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值