[论文笔记] 2021-Hindawi-Social Recommendation System Based on Hypergraph Attention Network

最新推荐文章于 2024-09-16 00:03:40 发布

多想偷得浮生半日闲

最新推荐文章于 2024-09-16 00:03:40 发布

阅读量442

点赞数

分类专栏：论文阅读笔记文章标签：论文阅读深度学习人工智能

本文链接：https://blog.csdn.net/weixin_46448399/article/details/129290174

版权

论文阅读笔记专栏收录该内容

8 篇文章 1 订阅

订阅专栏

论文提出HASRE模型，利用超图建模用户间的高阶关系，通过图注意力机制捕捉不同朋友的影响。模型在三个数据集上表现优越，解决了传统图神经网络无法捕获复杂关系的问题。同时，模型通过超边级和节点级注意力机制突出重要信息，优化用户和物品的表示。

摘要由CSDN通过智能技术生成

1 摘要

论文链接：https://www.hindawi.com/journals/cin/2021/7716214/
代码链接：TensorFlow，未找到代码资源

由于图结构在社交网络和图神经网络中强大的表示能力，图神经网络在社会化推荐系统中的应用变得越来越广泛。尽管图神经网络已经成功应用于社会化推荐系统，但实际应用中性能受到限制。主要原因在于它们只利用了成对的用户关系，无法捕获用户之间的高阶关系。针对这一问题，本文提出一个模型——HASRE，将超图注意力网络应用到社会化推荐系统中。具体来说，使用超图建模用户之间的高阶关系；使用图注意力机制捕获不同朋友的影响，并自适应地为用户提供模型选择信息。在三个数据集上的实验证明了该模型的优越性。

2 介绍

社会影响力（social influence）：朋友的行为会影响用户的态度和行为。
社会同质性（social homophily）：有相似兴趣的用户之间会建立连接，成为朋友。

本文要解决的问题：

（1）基于图神经网络的社交推荐方法无法捕获用户之间复杂的高阶关系。

用户之间的一阶关系是指成对的用户关系，而用户之间的高阶关系是指与用户节点相关的多个邻居节点。如两个或两个以上的用户是彼此的朋友或者与用户有相似兴趣的陌生人，如图1所示。

用户之间复杂的高阶关系

（2）如何突出显示每个超边上具有重要信息的节点。

在三角形语义主题的超图中传播和聚合用户意图时，有些节点信息非常重要，而其他节点信息则不然。此外，对于用户节点，用户之间存在不同程度的影响。

本文的贡献（创新点）：

（1）使用超图模型来构建用户之间复杂的关系；

（2）创造性地将图注意网络融入到超图结构中，可以更加关注重要用户的信息。

3 问题定义

3.1 符号定义

$U = \{u_1,u_2,u_3,...,u_m\}$ 表示用户集， $I = \{i_1,i_2,i_3,...,i_n\}$ 表示物品集。用户-物品交互矩阵用 $\in \mathbb{R}^{m \times n}$ 表示，用户购买了物品，则对应元素值为1；否则为0。社交网络用对称关系矩阵 $\in \mathbb{R}^{m \times m}$ 表示（社交网络图为无向图）。令 $h_u^{(l)} \in \mathbb{R}^{d^{(l)}}$ 表示用户 $u$ 在 $l$ 层的向量表示，维度为 $d$ 。 $H^{(l)} \in \mathbb{R}^{m \times d^{(l)}}$ 、 $P^{(l)} \in \mathbb{R}^{n \times d^{(l)}}$ 分别表示所有用户和物品的embedding向量。

3.2 超图定义

超图用 $G = (V, E)$ 表示，其中， $V = \{v_1,v_2,v_3,...,v_N\}$ 表示节点集， $E = \{e_1,e_2,e_3,...,e_M\}$ 表示边集，使用关联矩阵 $\in \mathbb{R}^{N \times M}$ 表示超图 $G$ 的拓扑结构，即

$C_{ij} = \begin{cases} 1, & \text{if } v_i \in e_j \\ 0, & \text{if } v_i \notin e_j \end{cases}$

如图2所示。超图中每个节点的属性可以用 $\left[x_1,x_2,x_3,...,x_N\right]^T \in \mathbb{R}^{N \times d}$ 表示。

超图网络结构

4 模型

本文提出的模型——HASRE，将超图注意力网络应用于社会化推荐系统中，整体框架如图3所示。

模型框架图

4.1 超图构建

为了更好地表示用户之间的高阶关系，首先将社交网络图与用户-物品交互图对齐，然后构建超图，包括用户节点、物品节点及其关系。本文使用三角形结构来表示三种语义主题（如图1所示），来构建超图。三种语义主题分别为“拥有相同的朋友”的“社交主题”（如 $u_3$ 、 $u_6$ 、 $u_8$ ）、“购买相同物品的朋友”的“联合主题”（如 $u_1$ 、 $u_2$ 、 $i_1$ ）、“购买相同物品的陌生人”（如 $u_2$ 、 $u_5$ 、 $i_2$ ）。

构建超图

4.2 超图注意网络

本文中超图通道主要用于处理三种三角形语义主题，并从用户之间的高阶关系中提取更加准确的用户embedding向量。为了控制基本用户embedding向量到不同通道的流量，使用自门控单元（a self-gating unit，SGU）来过滤输入信息，即

$H_c^{(0)} = f_{gate}^c(H^{(0)}) = H^{(0)} \odot \sigma (H^{(0)}W_g^c + b_g^c)$

其中， $W_g^c \in \mathbb{R}^{d \times d}$ 和 $b_g^c \in \mathbb{R}^d$ 分别表示SGU中训练的权重和偏置， $\in \{t,r\}$ 表示两个不同的通道， $H_t^{(0)}$ 指用于超图通道的基础用户embedding向量， $H_r^{(0)}$ 指显示社交网络的基础用户embedding向量， $\odot$ 表示点积， $\sigma$ 表示Sigmoid函数。SGU通过维度重加权调整特征粒度中的基本用户嵌入，最终获得超图信道的用户嵌入。

4.2.1 节点级注意力机制

给定一个节点 $v_i$ ，首先通过HyperGAT学习连接该节点的超边表示，使用注意力机制来突出显示某些节点对超边的重要性，即

$f_j^l = \sigma (\sum_{v_k \in e_j} a_{jk}W_1x_k^{l-1})$

其中， $W_1$ 是可训练的权重矩阵， $x_k^l$ 指节点 $k$ 在第 $l$ 层神经网络的特征信息。超图中节点 $X^{(0)}$ 的特征信息使用多层感知器（MLP）来组合超图中的用户基础embedding向量 $H_t^{(0)}$ 和物品基础embedding向量 $P_t^{(0)}$ ，即

$X^{(0)} = g(H_t^{(0)} \oplus P_t^{(0)})$

其中， $g$ 表示用户信息和物品信息的融合， $\oplus$ 表示两个向量之间的序列运算， $P_t^{(0)}$ 是超图中物品的基础embedding向量，获取方式与 $H_t^{(0)}$ 相同。 $a_{jk}$ 表示节点 $v_k$ 的信息被聚合到超边 $e_j$ 时对超边贡献的注意力系数，即

$a_{jk} = \frac{exp(a_1^T u_k)}{\sum_{v_p \in e_j} exp(a_1^T u_p)} \qquad u_k = LeakyReLU(W_1x_k^{l-1})$

其中， $a_1^T$ 是权重参数， $u_k$ 指超边 $e_j$ 上节点 $v_k$ 的相关性。

4.2.2 超边级注意力机制

所有超边都用 $\{f^l_j \mid \forall e_j \in E_i\}$ 表示。本文设计的超图结构主要用于利用用户之间的高阶关系来学习精确的用户embedding向量。如果超图中的节点 $v_i$ 是用户节点，使用超边信息来学习下一层用户的节点信息，即

$h_i^l = \sigma (\sum_{e_j \in E_i} b_{ij}W_2 f_j^l)$

其中， $h_i^l$ 表示节点 $v_i$ 更新的特征信息， $W_2$ 是可训练的权重矩阵， $b_{ij}$ 表示超边 $e_j$ 在节点 $v_i$ 上的注意力系数，即

$b_{ij} = \frac{exp(a_2^T v_j)}{\sum_{e_p \in E_i} exp(a_2^T v_p)} \qquad v_j = LeakyReLU([W_2 f_j^l \parallel W_1 h_i^{l-1}])$

其中， $a_2^T$ 是权重参数， $v_j$ 指超边 $e_j$ 上节点 $v_i$ 的相关性， $\parallel$ 是向量的连接操作。

4.3 学习全面的用户表示和物品表示

在通过L层HyperGAT传播的用户embedding后，对超图通道中每层获得的用户embedding进行平均，以形成超图通道的最终用户表示：

$H_t = \frac{1}{L+1} \sum_{l=0}^L H_t^{(l)}$

超图通道中只学习用户embedding向量，物品信息只是辅助作用。另外用户的社交关系是复杂的，超图中只是定义高阶的社交关系，社交网络中存在一些孤立的用户。因此，使用一个简单GCN来提取用户-物品交互图中的用户特征向量和物品特征向量，即

$H_r^{(l+1)} = D_u^{-1} Z P^{(l)} , \quad H_r^{(0)} = f_{gate}^r (H^{(0)}), \quad P^{(l+1)} = D_i^{-1} Z^T H_m^{(l)}, \quad H_m^{(l)} = \frac{1}{2} H_t^{(l)} + \frac{1}{2} H_r^{(l)}.$

其中， $H_r^{(l)}$ 是图卷积通道的门控用户embedding， $H_M^{(l)}$ 是超图通道的用户embedding和图卷积通道的用户embedding的组合， $D_u \in \mathbb{R}^{m \times m}$ 和 $D_i \in \mathbb{R}^{n \times n}$ 是 $Z$ 和 $Z^T$ 的度矩阵。故最终的用户embedding向量 $H$ 和物品embedding向量 $P$ 为

$H_t + \frac{1}{L+1} \sum_{l=0}^L H_r^{(l)}, \quad P = \frac{1}{L+1} \sum_{l=0}^L P^{(l)}$

4.4 模型优化

使用BPR损失进行训练，即

$L_{BPR} = \sum_{i \in I(u),j \notin I(u)} -log \sigma(\hat{r}_{u,i}(\Phi) - \hat{r}_{u,j}(\Phi)) + \lambda \parallel \Phi \parallel_2^2$

5 结论

（1）本文提出了一种将超图注意力网络应用于社会化推荐系统的模型，既考虑了用户之间的高阶关系，又区分了用户朋友的不同影响，在一定程度上提高了推荐系统的性能。

（2）未来发展方向：
$\bullet$ 将物品的属性信息考虑在内；
$\bullet$ 将动态神经网络应用于社会化推荐系统，即考虑动态的社交信息，以更好地挖掘用户的潜在偏好。

（3）个人拙见与疑问：
$\bullet$ 文中设计了三种类型的三角形语义主题，在超图通道中进行处理，但在处理时是否需要对其区分、如何区分存疑。
$\bullet$ 文中提到“超图中节点 $X^{(0)}$ 的特征信息使用多层感知器（MLP）来组合超图中的用户基础embedding向量 $H_t^{(0)}$ 和物品基础embedding向量 $P_t^{(0)}$ ”，为什么要这样写呢？
$\bullet$ 求 $H_m^{(l)}$ 以及最终的用户embedding向量 $H$ 时使用动态权重，区分不同来源信息的影响，这样处理是否能够提升推荐系统的性能？