在做推荐算法任务时,在(user, item)的交互数据集中进行建模是常见的方式,本文基于GNN对User侧和Item侧进行embedding的思路,介绍3篇相关论文。这三篇文章分别来自SIGIR 2019,2020,2021。
本文主要解决传统协同过滤算法,因为缺少对user-item交互数据中的协同信息(Collaborative Signal)较好的编码方式,从而无法很好的学到Embedding的问题。传统协同过滤方法是通过对ID类特征或者Category类特征进行简单的编码得到Embedding,然后通过User-Item交互数据对损失函数的定义后解码。简单的编码形式导致了模型学习到的Embedding信息有限。
具体地,如上图所示右图是(User,item)之间的交互路径。从图中u2->i2->u1路径我们可以发现u1和u2具有一定路径上(行为)的相似性。同时,对于i4->u3->i3->u1和i4->u2->i2->u1这两路径可以看出用户u1对i4的购买可能性大于对i5的购买可能性。
NGCF基于User-Item交互行为中的High-order connectivity来解决交互数据中的协同信息(Collaborative Signal)编码问题进行Embedding建模。
模型的Embedding Propagation Layer主要包含Message Construction和Message Aggregation两部分。
在Message Construction部分,对每个(user,item)定义从item到user传递的message为: