文献笔记|异构图池化|UaG|User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation

最新推荐文章于 2023-04-03 23:00:00 发布

江城暮

最新推荐文章于 2023-04-03 23:00:00 发布

阅读量1.1k

点赞数 1

分类专栏：文献笔记文章标签：机器学习推荐系统

本文链接：https://blog.csdn.net/qq_39087432/article/details/120341322

版权

文献笔记专栏收录该内容

13 篇文章 1 订阅

订阅专栏

文章目录

User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation

User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation

题目：《一人一图：基于异质图池化用户建模的新闻推荐方法》

作者：Chuhan Wu, Fangzhao Wu, Yongfeng Huang, Xing Xie

来源：IJCAI’ 21

研究对象

许多在线新闻平台采用新闻推荐技术，提供个性化的新闻服务，缓解用户信息过载[Okura et al.， 2017]。精确的用户兴趣建模是实现准确个性化新闻推荐的前提。

存在的问题

现有的新闻推荐方法主要通过序列模型或注意力模型对用户点击的新闻进行兴趣建模。例如，Okura et al.[2017] 提出使用GRU网络通过捕获用户的序列信息从他们点击的新闻中学习用户表示。Wu et al. [2019a] 提出使用注意力方法通过关注重要的新闻从他们点击的新闻中学习用户表示。然而，这些方法不能有效地建模用户行为之间的相关性，但用户行为之间的相关性通常可以为建模用户兴趣提供有用的行为上下文。

在这里插入图片描述

事实上，用户在新闻上的行为可能具有多种相关性。

在时间上相邻的点击新闻可能具有一定的相关性。例如，如图1所示，用户单击第一条和第二条都提到 NFL (职业橄榄球联盟) 新闻事件的新闻。
属于同一话题类别的新闻也可能有一定的关联性。例如，图1中的第一条新闻和最后一条新闻都属于“体育”类，它们在内容上很相似。
包含相同实体的新闻在吸引新闻点击方面也存在一定关系，因为新闻中的实体是用户兴趣的重要标志[Wang et al., 2018]。例如，图1中的第二条和最后一条新闻都提到了实体“Cowboys”，这是一个球队的名字。我们可以推断，这个用户点击这两个新闻是因为他/她对这个团队有潜在的兴趣。

这些用户行为之间的关系可以为更精确的用户兴趣建模提供非常有用的线索。然而，在现有的新闻推荐方法中，主要使用用户的行为集或行为序列来表示用户，并没有有效地建模用户行为之间的丰富相关性，这可能导致推荐的结果不是最优的。

作者的方法

本文提出了一种新闻推荐的用户建模方法 user-as-graph (UaG)，该方法将每个用户建模为一个个性化的异构图，从用户的行为出发，更好地捕捉用户建模的细粒度行为相关性，更准确地建模用户兴趣。用户图节点包含点击的新闻、话题和实体，在用户连续点击的新闻、新闻与其话题、新闻与其实体之间创建边。与现有的使用序列或注意力模型来处理行为序列或集合的方法不同，从个性化异构图中学习用户嵌入是困难的。因此，我们提出一种异构图池化 (HG-Pool) 方法，迭代地压缩个性化异构图，同时考虑不同类型节点的不同特征。它针对不同类型的节点使用不同的池化图神经网络，从整个图中总结出特定类型的图信息，并根据相同类型的节点的特征和整个图的拓扑进行聚合。

方法

个性化图的构建

首先，为了用户兴趣建模，我们在 UaG 方法中引入个性化图，该方法由用户的新闻点击行为构建而成。它包含三种节点，包括新闻、话题和实体。

给定一个目标用户 $u$ ，我们将该用户点击的 $M$ 条新闻集合表示为 $KaTeX parse error: Undefined control sequence: \cal at position 2: {\̲c̲a̲l̲{N}} = \{n_1, n…$ ，集合中的元素按照用户点击的时间顺序排列。

在时间上相邻的用户行为通常具有一定的关联性。例如，在图1中，用户连续点击的两则新闻都是关于类似的事件。由于新闻点击的序列信息对用户兴趣动态建模具有重要意义。因此，我们将每一条被点击的新闻视为一个节点，并将点击行为在时间上相邻的新闻连接起来。

另外，新闻话题是建模新闻内容和用户兴趣非常有用的线索。同一话题类别的新闻在用户兴趣建模中也可能存在一定的关联。因此，我们将话题信息合并到用户图中，将每个话题类别 $c_i$ 视为一个节点，并将每个新闻节点 $n_i$ 与其关联的话题节点 $c_{[n_i]}$ 连接起来。

此外，新闻实体对于新闻和用户建模非常重要，因为用户往往会因为新闻标题中提到的实体的吸引力而决定点击新闻，比如名人或组织，如运动队。为了整合实体信息，我们将实体视为另一种节点，将 $KaTeX parse error: Undefined control sequence: \cal at position 2: {\̲c̲a̲l̲{N}}$ 中新闻提到的实体集合 $KaTeX parse error: Undefined control sequence: \cal at position 2: {\̲c̲a̲l̲{E}} = \{e_1, e…$ (K为实体数量) 整合到用户图中。我们将每个新闻节点 $n_i$ 与它所提到的实体的节点连接起来，最终形成个性化异构图 $G^{(0)}$ 。

在这里插入图片描述

异质图池化

由于在我们的 UaG 方法中，每个用户都被表示为一个个性化的异构图 $G^{(0)}$ ，因此从异构图中学习得到用户兴趣嵌入 ${\bf{u}}$ 用于新闻推荐至关重要。

在这里插入图片描述

对于节点类型为 $T$ 的异构图 ( $G^{(0)}$ 的 $T$ 为3)，我们分别将其初始图邻接矩阵和节点特征表示为 $A^{(0)}$ 和 $X^{(0)}$ 。我们采用多层GNN来处理图，其输入是 $A^{(0)}$ 和 $X^{(0)}$ ，经过 $l$ 层GNN后输出 $A^{(l)} \in {\Bbb{R}}^{N^{(l)} \times N^{(l)}}$ 和 $X^{(l)} \in {\Bbb{R}}^{N^{(l)} \times D}$ 。其中 $N^{(l)} = \sum^T_{i=1} N^{(l)}_i$ 是所有类别节点数 $N^{(l)}_i$ 的总和。由于不同类型的节点可能具有不同的特征，我们需要对异构图中的节点进行类型区分。具体来说，我们将图的邻接矩阵 $A^{(l)}$ 分为 $T^2$ 个子矩阵，将节点特征矩阵 $X^{(l)}$ 按照节点类型分为 $T$ 个子矩阵。我们将第 $i$ 行第 $j$ 列的邻接子矩阵表示为 $A^{(l)}_{i,j} \in {\Bbb{R}}^{N^{(l)}_i \times N^{(l)}_j}$ (表示第 $i$ 和第 $j$ 种节点之间有连接)，并且将第 $i$ 种特征的子矩阵表示为 $X^{(l)}_i \in {\Bbb{R}}^{D \times N^{(l)}_i}$ (表示第 $i$ 种节点的特征)。受 [Ying et al., 2018] 的DiffPool 的启发，我们提出采用 $T$ 种池化图神经网络来独立地学习每种节点的池化矩阵，具体如下：
$S^{(l)}_i = {\rm{PoolGNN(A^{(l)}, X^{(l)};\Theta^{(l)}_i)}} \tag{1}$
其中 $S^{(l)}_i \in {\Bbb{R}}^{N^{(l)} \times N^{(l+1)}_i}$ 是第 $i$ 种节点类型的池化矩阵， ${\rm{\Theta}}^{(l)}_i$ 是池化GNN的参数集合。通过这种方式，不同类型节点的特征就可以用不同的节点的特定池化矩阵 $S^{(l)}_i$ 来建模。

现有的同构图池化方法，如 DiffPool，GNN 池化输出的矩阵的和将应用于邻接矩阵 $A^{(l)}$ 和节点特征矩阵 $X^{(l)}$ 。但这种方法会将不同类型的节点不加区分地聚类在一起，对于异构图，其属性信息无法保留，因此不适合异构图池化。故，我们提出将池化矩阵 $S^{(l)}_i$ 压缩为一个概括的 $T^{(l)}_i \in {\Bbb{R}}^{N^{(l)}_i \times N^{(l+1)}_i}$ ，以传递节点特定的图信息，上述过程可以表述为：
$T^{(l)}_i = {\rm{softmax}}(W^{(l)}_iS^{(l)}_i+B^{(l)}_i) \tag{2}$
其中 $W^{(l)}_i$ 和 $B^{(l)}_i$ 是压缩 $S^{(l)}_i$ 的参数。为了避免索引操作，我们对 $T^{(l)}_i$ 应用零填充 (只有第 i 种节点对应的行是非零的) 来获得对齐的池化矩阵 $P^{(l)}_i \in {\Bbb{R}}^{N^{(l)} \times N^{(l+1)}_i}$ 。

然后，我们提出了一种邻接矩阵聚合器和节点特征聚合器来计算新的邻接矩阵 $A^{(l+1)}$ 和节点特征 $X^{(l+1)}$ 。邻接矩阵聚合器将先前的邻接矩阵 $A^{(l)}$ 和 $T$ 个对齐的池化矩阵 $[P^{(l)}_1,...P^{(l)}_T]$ 作为输入。我们将新的邻接子矩阵的第 $i$ 行第 $j$ 列表示为 $A^{(l+1)}_{i,j} \in {\Bbb{R}}^{N^{(l+1)}_i \times N^{(l+1)}_j}$ ，可以按照下式计算：
$A^{l+1}_{i,j} = P^{(l) \top}_iA^{(l)}P^{(l)}_j. \tag{3}$
整个池化的邻接矩阵 $A^{(l+1)}_{i,j} \in {\Bbb{R}}^{N^{(l+1)}_i \times N^{(l+1)}_j}$ 是所有邻接子矩阵的二维拼接。通过这种方式，不同类型的节点就不会被聚类在一起，并且异质图的属性也能够被保留下来。此外，不同种节点之间的关系可以利用不同池化矩阵之间的关系建模。节点特征聚合器接收节点特征矩阵 $X^{(l)}$ 和对齐的池化矩阵作为输入。我们将第 $i$ 种节点的新的特征子矩阵表示为 $X^{(l+1)}_i$ ，其公式如下：
$X^{(l+1)}_i = P^{(l)\top}_i X^{(l)}. \tag{4}$
节点特征矩阵的输出是 $T$ 种节点的特征子矩阵的拼接，例如： $X^{(l+1)} = concat(X^{(l+1)}_1, X^{(l+1)}_2,...,X^{(l+1)}_T)$ 。

在异构图池模块中，我们将HG-Pool方法应用于每个GNN层，并使用每个GNN层的多个栈分层学习图表示，如图2所示。应用 HG-Pool 方法经过 $L$ 轮迭代之后，原始异构图将被压缩成一个具有 $T$ 个节点的紧密连接的小图，其中每个节点压缩了原始图中相应类型节点的信息。最后，我们使用 DiffPool [Ying et al., 2018] 层将该图转换为一个单独的节点，该节点汇总了整个图的信息。将这个节点的嵌入作为输出，表示新闻推荐的用户兴趣嵌入 $\bf{u}$ 。

节点表示学习

接下来我们介绍如何学习个性化异质图的原始节点表示。在学习新闻节点表示时，受 [Wu et al., 2019c] 的启发，我们采用了 Transformer 来学习新闻标题的文字表示，并且使用注意力网络通过关注关键字来得到新闻节点表示。在表示话题结点时，我们采用话题类别的嵌入作为节点表示。对于实体节点，根据 [Wang et al., 2018]，我们首先通过 TransE [Bordes et al., 2011] 方法从维基数据知识图中学习实体嵌入，接着对这些嵌入应用稠密层来对齐特征维度。值得注意的是，实体嵌入是在模型训练期间微调的。

在这里插入图片描述

模型训练

我们在新闻点击预测任务中训练 User-as-Graph 方法。我们使用一个新闻编码器来学习候选新闻嵌入，并根据侯选新闻嵌入与我们的 user-as-graph 模型学习到的用户兴趣嵌入的相关性来预测侯选新闻嵌入的点击分数进行模型训练。具体来说，在新闻编码器中，我们使用了注意力的多视图学习框架 [Wu et al., 2019a]，将新闻标题、话题类别和实体作为新闻的不同视图合并，如图4所示。与节点表示学习类似，我们使用 Transformer 和注意网络来学习标题表示 ${\bf{n}}_t$ ，并在话题嵌入层之后增加一个稠密层来学习隐藏的话题表示 ${\bf{n}}_c$ 。此外，我们在实体嵌入层后采用一个注意力网络通过选择重要的实体来学习基于实体的新闻表示 ${\bf{n}}_e$ 。最后的统一的侯选新闻嵌入 ${\bf{n}}^c$ 是将三种新闻表示通过注意力网络聚合而成的。用户 $u$ 点击侯选新闻 ${\bf{n}}^c$ 的点击预测分数 $y$ 通过它们嵌入的内积来计算，即 ${\bf{u}}^\top {\bf{n}}^c$ 。这些分数用于个性化的新闻排名和显示。根据 [Wu et al., 2019c] ，对于每条被点击的新闻，我们任意选择 $P$ 条在相同 impression 下显示的未被点击的新闻，从而构建训练样本。模型训练的损失函数表示如下：
$KaTeX parse error: Undefined control sequence: \cal at position 3: {\̲c̲a̲l̲{L}} = -\frac{…$
其中 $KaTeX parse error: Undefined control sequence: \cal at position 1: \̲c̲a̲l̲{S}$ 是训练集， $y_i$ 和 $y_{i,j}$ 分别表示第 $i$ 次点击样本的预测点击分数和相关联的第 $j$ 次未点击样本。

实验

在这里插入图片描述

江城暮

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
文献笔记|异构图池化|UaG|User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation

文章目录User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation研究对象存在的问题作者的方法相关工作——图池化方法个性化图的构建异质图池化节点表示学习模型训练实验User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation题目：《一人一图：基于异质图池化用户建模的新闻推荐方法》作
复制链接

扫一扫