Self-supervised Graph Neural Networks for Multi-behavior Recommendation-IJCAI 2022 读书笔记

RebeccaCute

已于 2023-03-08 20:31:06 修改

阅读量4.6k

点赞数 6

文章标签：深度学习人工智能神经网络推荐系统

于 2022-10-25 21:33:25 首次发布

本文链接：https://blog.csdn.net/rebecca1809/article/details/127520519

版权

0 作者

Shuyun Gu , Xiao Wang , Chuan Shi $^∗$ and Ding Xiao

1 动机

传统推荐系统一般只考虑购买行为，忽略了放入购物车、浏览行为；
本文将购买、放入购物车、浏览三个行为一起考虑；
考虑购买和放入购物车行为的差异，进行对比学习；
考虑购买和浏览行为的差异，进行对比学习。

2 相关工作

Graph Neural Networks(GNN): 参考文献[3]
NGCN: 参考文献[4]
LightGCN: 参考文献[5]

3 主要算法

在这里插入图片描述

上图表明将算法主要分为三个部分。图中下标1、2、3分别表示购买、放入购物车、浏览三个行为。

$\textcircled{1}$ 利用GCN对三个行为进行编码，得到 $X_{1}$ 、 $X_{2}$ 、 $X_{3}$ ；
$\textcircled{2}$ 求出用户和商品的编码 $e_{u}$ 和 $e_{i}$ ；
$\textcircled{3}$ 利用对比学习(Contrastive Learning)来建立购买和放入购物车行为之间的差异、购买和浏览行为之间的差异。

3.1 子图 $\textcircled{1}$

子图 $\textcircled{1}$ ：对三个行为编码。
子图 $\textcircled{1}$ 的数据说明：

$G$ ：原始数据集，包含用户ID以及他们的购买、放入购物车、浏览三个行为。
$G_1$ ：用户和购买关系图；
$G_2$ ：用户和放入购物车关系图；
$G_3$ ：用户和浏览关系图。
算法流程：
利用GCN对三个行为进行编码，得到 $X_{1}$ 、 $X_{2}$ 、 $X_{3}$ 。

3.2 子图 $\textcircled{2}$

子图 $\textcircled{2}$ 求用户和商品的编码。首先将 $X_{1}$ 、 $X_{2}$ 、 $X_{3}$ 拆分为用户在三个行为下的编码 $X_{U1}$ 、 $X_{U2}$ 、 $X_{U3}$ 和商品在三个行为下的编码 $X_{I1}$ 、 $X_{I2}$ 、 $X_{I3}$ 。接下来分别求用户的编码和商品的编码。

3.2.1 对用户编码

利用用户 $u$ 的购买、放入购物车、浏览三个行为的编码，对用户 $u$ 进行编码：
$\boldsymbol{e}_{\boldsymbol{u}}=\sigma\left\{\boldsymbol{W}\left(\sum_{k=1}^{K} a_{u k} * \boldsymbol{x}_{\boldsymbol{u} \boldsymbol{k}}\right)+\boldsymbol{b}\right\} \tag1$
– $a_{u k}$ ：用户 $u$ 的行为 $k$ 对应的权重；
– $\boldsymbol{x}_{\boldsymbol{u} \boldsymbol{k}}$ ：用户 $u$ 在行为 $k$ 下的编码，来源于 $X_{U1}, X_{U2}, X_{U3}$ ；
– $\boldsymbol{W}$ 和 $\boldsymbol{b}$ ：神经网络的权重和偏置；
计算 $a_{u k}$ ：分子为单个行为，分母为三个行为的加权累加和。
$a_{u k}=\frac{\exp \left(w_{k} * n_{u k}\right)}{\sum_{m=1}^{K} \exp \left(w_{m} * n_{u m}\right)} \tag2$
– $w_{k}$ ：行为 $k$ 的权重，作者用的是一个全局的变量，所有用户采用相同的权重值，比如购买是0.5，放入购物车是0.3，浏览是0.2;
– $n_{u_m}$ ：用户 $u$ 在行为 $m$ 下的物品个数，比如张三购买了2个商品，将3个商品放入购物车，浏览了5个商品。
作者提供的代码里，本部分对应的代码如下。
– Lines181-183是式(2)的分子。在论文里， $n_{uk}$ 是the number of associations of user $u$ under behavior $k$ 。但是在作者提供的代码里，使用的是各个行为下物品个数的占比。
– Lines184-186分别求出 $a_{u 1}$ 、 $a_{u 2}$ 、 $a_{u 3}$ 。Line187 中pachas_u、cart_u以及view_u分别表示用户购买行为、放入购物车行为、浏览行为的编码矩阵。
– Line187为式(1)中的 $\sum_{k=1}^{K} a_{u k} * \boldsymbol{x}_{\boldsymbol{u} \boldsymbol{k}}$ 。

在这里插入图片描述

3.2.2 对商品进行编码

将第 $i$ 个商品在行为 $k$ 下的编码拼接起来(Cat( $\cdot$ ))，并利用多层感知机 $g(\cdot)$ 计算 $\boldsymbol{e}_{\boldsymbol{i}}$ 。
$\boldsymbol{e}_{\boldsymbol{i}}=g\left\{\operatorname{Cat}\left(\boldsymbol{x}_{\boldsymbol{i k}}\right)\right\} \tag3$
作者提供的代码里，本部分对应的代码如上图。
– Line190和Line191是将物品三个行为的编码矩阵按照第二维和第三维进行拼接，得到pos_i_emb和neg_i_emb。
– Line194计算BPR loss。将Lines 187、190、191的 $u\_emb$ 、 $pos\_i\_emb$ 、 $neg\_i\_emb$ 作为输入，带入BPR loss计算式中，求得BPR loss。

3.3 子图 $\textcircled{3}$

子图 $\textcircled{3}$ 为利用constractive learning计算两两行为之间的差异：购买和放入购物车之间的差异、购买和浏览之间的差异。以下分两个方面考虑：用户购买和放入购物车之间的差异、购买和浏览之间的差异以及商品被购买和被放入购物车之间的差异、被购买和被浏览之间的差异。

3.3.1 计算用户购买和放入购物车之间的差异、购买和浏览之间的差异

计算式如下：
$\mathcal{L}_{s s t\_k^{\prime}}^{u s e r}=\sum_{u \in U}-\log \frac{\left.\sum_{u^{+} \in U} \exp \left\{\left(\boldsymbol{x}_{\boldsymbol{u} \boldsymbol{1}}\right)^{T} \boldsymbol{x}_{\boldsymbol{u}^+\boldsymbol{k}^{\prime}} / \tau\right)\right\}}{\sum_{u^{-} \in U} \exp \left\{\left(\boldsymbol{x}_{\boldsymbol{u} \boldsymbol{1}}\right)^{T} \boldsymbol{x}_{\boldsymbol{u}^{-} \boldsymbol{k}^{\prime}} / \tau\right\}} \tag4$
– $k^{\prime}$ ：取值为2和3，2代表放入购物车，3代表浏览；
– $u^{+}$ 和 $u^{-}$ ：以用户 $u$ 为基础，找到用户 $u$ 的正用户集和负用户集， $PM I$ 值用于衡量两个用户 $u$ 和 $u^{'}$ 的相似度。当该大于某个阈值时， $u^{'}$ 为 $u$ 的正用户，否则为 $u$ 的负用户。计算方法如下：
$\begin{array}{c} P M I\left(u, u^{\prime}\right)=\log \frac{p\left(u, u^{\prime}\right)}{p(u) p\left(u^{\prime}\right)} \\ p(u)=\frac{|I(u)|}{|I|} \\ p\left(u, u^{\prime}\right)=\frac{\left|I(u) \cap I\left(u^{\prime}\right)\right|}{|I|} \end{array} \tag5$
式(5)中第一行对数后方的分子：为式(5)中第三行。式(5)中第三行计算两个用户 $u$ 和 $u^{'}$ 的相似度，其分子为两个用户在同一个行为下的相同商品的个数，分母为所有商品的个数。
式(5)中第一行对数后方的分母：为式(5)中第二行。计算用户 $u$ 在某个行为下的商品个数/所有商品的个数。
– $\tau$ ：温度参数，作者的代码里 $\tau$ 取值为1。

3.3.2 计算商品被购买和被放入购物车之间的差异、被购买和被浏览之间的差异

计算商品被购买和放入购物车之间的差异、商品被购买和浏览之间的差异，计算方法与用户类似。计算式如下：
$\mathcal{L}_{s s t\_k^{\prime}}^{item}=\sum_{i \in I}-\log \frac{\left.\sum_{i^{+} \in I} \exp \left\{\left(\boldsymbol{x}_{\boldsymbol{i} \boldsymbol{1}}\right)^{T} \boldsymbol{x}_{\boldsymbol{i}^+\boldsymbol{k}^{\prime}} / \tau\right)\right\}}{\sum_{i^{-} \in I} \exp \left\{\left(\boldsymbol{x}_{\boldsymbol{i} \boldsymbol{1}}\right)^{T} \boldsymbol{x}_{\boldsymbol{i}^{-} \boldsymbol{k}^{\prime}} / \tau\right\}} \tag6$

3.3.3 Contrastive learning中的问题

在作者提供的代码里，并没有看到PMI的计算。式(4)和(6)也与代码不一致。在代码里，Contrastive learning 的计算步骤为：
在这里插入图片描述

Line 19调用Lines 9-16计算两个行为的相似度矩阵sim()
Lines10-11：分别计算用户在两个行为下的二范数。
Lines13-14：(未完待续)
计算…(未完待续)

3.4 损失函数

总的损失函数如下：
$\mathcal{L}=\mathcal{L}_{s t}+\lambda \mathcal{L}_{s s t}+\mu\|\Theta\|_{2}^{2} \tag8$
第一项为BPR Loss：
$\mathcal{L}_{s t}=\sum_{(u, i, j) \in O}-\log \left\{\sigma\left(e_{u}^{T} e_{i}-e_{u}^{T} e_{j}\right)\right\} \tag9$

$e_u$ ：用户 $u$ 的编码；
$e_i$ ：用户 $u$ 购买过、或放入购物车、或浏览过的商品编码；
$e_j$ ：用户 $u$ 未购买过、或未放入购物车、或未浏览过的商品编码，作者在代码里面选的64个未产生过行为的商品。

第二项为对比学习产生的Loss:
$\mathcal{L}_{s s t}=\sum_{k^{\prime}=2}^{K}\left(\mathcal{L}_{s s t-k^{\prime}}^{u s e r}+\mathcal{L}_{s s t{-k^{\prime}}}^{i t e m}\right) \tag{10}$

$\mathcal{L}_{s s t\_k^{\prime}}^{u s e r}$ ：同公式(4)；
$\mathcal{L}_{s s t{\_k^{\prime}}}^{i t e m}$ ：商品的Loss。

参考文献

[1] Self-supervised Graph Neural Networks for Multi-behavior Recommendation
[2] 源代码：https://github.com/GuShuyun/MBRec
[3]Chen Gao, Yu Zheng, Nian Li, Yinfeng Li, Yingrong Qin, Jinghua Piao, Yuhan Quan, Jianxin Chang,
Depeng Jin, Xiangnan He, et al. Graph neural networks for recommender systems: Challenges, methods, and directions.arXiv preprint arXiv:2109.12843, 2021.
[4]Xiang Wang, Xiangnan He, Meng Wang, Fuli Feng, and Tat-Seng Chua. Neural graph collaborative filtering. In Proceedings of the 42nd international ACM SIGIR conference on Research and Development in Information Retrieval, pages 165–174, 2019.
[5]Xiangnan He, Kuan Deng, Xiang Wang, Yan Li, Yongdong Zhang, and Meng Wang. LightGCN:
Simplifying and powering graph convolution network for recommendation. In Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 639–648, 2020.

RebeccaCute

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
16
评论
Self-supervised Graph Neural Networks for Multi-behavior Recommendation-IJCAI 2022 读书笔记

传统推荐系统一般只考虑购买行为，忽略了放入购物车、浏览行为。本文将购买、放入购物车、浏览三个行为一起考虑。考虑购买和放入购物车行为的差异，进行对比学习。考虑购买和浏览行为的差异，进行对比学习。
复制链接

扫一扫