st-link v2使用方法_使用图神经网络做基于会话的推荐

最新推荐文章于 2024-10-07 10:41:17 发布

weixin_39781363

最新推荐文章于 2024-10-07 10:41:17 发布

阅读量654

点赞数

文章标签： st-link v2使用方法

本文链接：https://blog.csdn.net/weixin_39781363/article/details/111372475

版权

1、背景介绍

现有基于会话的推荐，方法主要集中于循环神经网络和马尔可夫链，论文提出了现有方法的两个缺陷：

1)当一个会话中用户的行为数量十分有限时，这些方法难以获取准确的用户行为表示。如当使用RNN模型时，用户行为的表示即最后一个单元的输出，作者认为只有这样并非十分准确。

2)根据先前的工作发现，物品之间的转移模式在会话推荐中是十分重要的特征，但RNN和马尔可夫过程只对相邻的两个物品的单向转移关系进行建模，而忽略了会话中其他的物品。

针对上面的问题，作者提出使用图网络来做基于会话的推荐，其整个模型的框架如下图所示：

接下来，我们就来介绍一下这个流程吧。

2、模型介绍

2.1 符号定义

V={v1,v2,...,vm} 代表所有的物品。s=[vs,1,vs,2,...,vs,n]代表一个session中按照时间先后排序的用户点击序列，我们的目标是预测用户下一个要点击的物品vs,n+1

2.2 子图构建

我们为每一个Session构建一个子图，并获得它对应的出度和入度矩阵。

假设一个点击序列是v1->v2->v4->v3，那么它得到的子图如下图中红色部分所示：

再假设一个点击序列是v1->v2->v3->v2->v4，那么它得到的子图如下：

同时，我们会为每一个子图构建一个出度和入度矩阵，并对出度和入度矩阵的每一行进行归一化，如我们序列v1->v2->v3->v2->v4对应的矩阵如下：

上图中，左边的矩阵是出度矩阵，右边的矩阵是入度矩阵，如果同时考虑出度和入度，模型学习的就不是简单的单向转移关系了，而是更加丰富的双向关系。

2.3 基于Graph学习物品嵌入向量

基于Graph学习物品的嵌入向量，作者借鉴的下面这篇文章《GATED GRAPH SEQUENCE NEURAL NETWORKS》(地址：https://arxiv.org/pdf/1511.05493v3.pdf)的做法，其实就是一个GRU单元，不过在输入时，模型做了一定的改进。

模型的输入计算公式如下：

我们还是使用刚才的序列v1->v2->v3->v2->v4来一点点分析输入的过程。

1)ats,i是t时刻，会话s中第i个点击对应的输入

2)As,i:代表的是一个分块矩阵，它是1*2n的，n代表序列中不同物品的数量，而非序列的长度，此处是4，而非5。举例来说，假设我们当前的i=2，那么其对应的As,2:=[0,0,1/2,1/2 | 1/2,0,1/2,0]。我们可以把As,i:拆解为[As,i:,in,As,i:,out]

3)vt-1i可以理解为序列中第i个物品，在训练过程中对应的嵌入向量，这个向量随着模型的训练不断变化，可以理解为隐藏层的状态，是一个d维向量。

4)H是d*2d的权重向量，也可以看作是一个分块的矩阵，可以理解为H=[Hin|Hout]，每一块都是d*d的向量。

那么我们来看看计算过程：

1)[vt-11,...,vt-1n] ，结果是d * n的矩阵，转置之后是n*d的矩阵，计作vt-1

2)As,i:vt-1H相当于[As,i:,invt-1Hin , As,i:,outvt-1Hout]，即拆开之后相乘再拼接，因此结果是一个1 * 2d的向量。

上面的过程，相当于分别对一个节点的出度和入度进行处理，再进行合并。该过程是我通过代码慢慢理解的，代码如下：

fin_state = tf.reshape(fin_state, [self.batch_size, -1, self.out_size])fin_state_in = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]), self.W_in) + self.b_in, [self.batch_size, -1, self.out_size])fin_state_out = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]), self.W_out) + self.b_out, [self.batch_size, -1, self.out_size])av = tf.concat([tf.matmul(self.adj_in, fin_state_in), tf.matmul(self.adj_out, fin_state_out)], axis=-1)

上面的代码中，fin_state相当于保存的是我们的vt-1，self.W_in相当于我们的Hin， self.W_out相当于我们的Hout，self.adj_in相当于As,i:,in，self.adj_out相当于As,i:,out。

有一丢丢的复杂，上面是我个人的理解的计算过程，大家可以作为参考。

上面的输入，我们充分考虑了图的信息，接下来，就是GRU单元了，这里的GRU单元没有太多变化，公式如下：