NGCF及其改进模型LightGCN：Neural Graph Collaborative Filtering & LightGCN

最新推荐文章于 2024-04-05 14:59:32 发布

Moonpie.

最新推荐文章于 2024-04-05 14:59:32 发布

阅读量967

点赞数

分类专栏： KG RecSys 文章标签：推荐系统

本文链接：https://blog.csdn.net/jxpal/article/details/116269831

版权

RecSys 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

6 篇文章 1 订阅

订阅专栏

emm…图片复制过来显示不了（因为我太懒了0.0），要看图的话可以去我的博客瞅瞅，嘿嘿嘿
对了，有些英文短句假如翻译成中文，阅读的时候就太搞脑子了，所以我干脆就不翻译了

我的博客地址：https://hikg.net/archives/125/

NGCF

Motivation

先前的方法仅仅使用描述性特征（比如ID、属性）来构造embedding function，而没有考虑过user-item interactions（或者仅仅是在定义目标函数时使用）

Model

High-order connectivity表示到达 $u_1$ 的，路径长度大于1的节点

例如： $u_1 \leftarrow i_2 \leftarrow u_2$ 表示 $u_1$ 、 $u_2$ 之间的行为相似度，因为这两者都与 $i_2$ 发生过交互

$u_1 \leftarrow i_2 \leftarrow u_2 \leftarrow i_4$ ，表示 $u_1$ 很可能对 $i_4$ 感兴趣，因为相似的用户 $u_2$ 之间与 $i_4$ 发生过交互。

模型分为3层：

1. Embedding Layer

将user u（item i）的单个embedding向量 $e_u \in \mathbb{R}^d$ （ $e_i \in \mathbb{R}^d$ ）组建成一个embedding look-up table，用作之后进行传播的初始矩阵：

$E = [e_{u_1}, ..., e_{u_N}, e_{i_1},..., e_{i_M}]$

2. Embedding Propagation Layers

Message Construction：

$\large m_{u \leftarrow i} = f(e_i,e_u,p_{ui})$

$\large m_{u \leftarrow i} = \frac{1}{\sqrt{|N_u||N_i|}} (W_1e_i + W_2(e_i \odot e_u))$

$p_{ui}$ 是在边 $(u, i)$ 上做传播时的衰减因子，反映了historical item对用户偏好的贡献

使用传统GCN的方法实现 $f(\cdot)$ 函数， $N_u$ 代表user u的一跳邻居
Message Aggregation：

$\large e_u^{(1)} = LeakyReLU(m_{u \leftarrow u} + \sum\limits_{i \in N_u}m_{u \leftarrow i})$

不仅考虑了u的邻居，还考虑到了u的self-connection $m_{u \leftarrow u}$
High-order Propagation：

$\Large \begin{equation} e_u^{(k+1)} = \sigma\bigg( W_1e_u^{(k)} + \sum\limits_{i \in N_u} \frac{1}{\sqrt{|N_u||N_i|}} \big (W_1e_i^{(k)} + W_2(e_i^{(k)} \odot e_u^{k}) \big) \bigg) \end{equation} $

$\Large e_i^{(k+1)} = \sigma\bigg( W_1e_i^{(k)} + \sum\limits_{u \in N_i} \frac{1}{\sqrt{|N_u||N_i|}} \big( W_1e_u^{(k)} + W_2(e_u^{(k)} \odot e_i^{k}) \big) \bigg)$

$\odot$ 表示按元素乘积，这使得传递的消息取决于e_i和e_j之间的亲和力，即来自相似的item会传递更多的消息。

3. Prediction Layer

将每层得到的user u的表示拼接起来，得到 $u$ 的最终表示：

$\Large e_u^* = e_u^{(0)} ||...|| e_u^{(L)}$

同理可得到 $i$ 的最终表示：

$\Large e_i^* = e_i^{(0)} ||...|| e_i^{(L)}$

最后使用内积来计算user u对item i的偏好：

$\Large \hat{y}_{NGCF}(u,i) = e_u^{*T} e_i^*$

Optimization

$\Large Loss = \sum\limits_{(u,i,j) \in O} -ln \sigma(\hat{y}_{ui} - \hat{y}_{uj}) + \lambda || \theta ||_2^2$

$\large O = \{ (u,i,j) | (u,i) \in \mathbb{R}^+, (u,j) \in \mathbb{R}^- \}$ 表示成对的训练数据

$\mathbb{R}^+$ 表示observed interactions， $\mathbb{R}^-$ 表示unobserved interactions

LightGCN

GCN起初是为节点分类任务提出的，这上面的每个节点都拥有丰富的属性作为输入。然而在user-item interaction graph中，每个节点仅仅由一个one-hot ID描述，并没有具体的语义信息。由于ID embedding的信息量较少，所以使用多层的非线性特征变换是没有意义的，反而会增加模型训练的难度。

作者通过实验证明了：feature transformation $W_1$ $W_2$ 、nonlinear activation $σ (\cdot)$ 对NGCF模型没有任何贡献。