(TKDE 2023)GATrust: A Multi-Aspect Graph Attention Network Model for Trust Assessment in OSNs

DDyk做推荐

已于 2023-11-29 00:37:30 修改

阅读量974

点赞数 23

文章标签： php 开发语言推荐算法神经网络人工智能深度学习

于 2023-11-28 23:09:35 首次发布

本文链接：https://blog.csdn.net/DDykQAQ/article/details/134679077

版权

本文提出GATrust，一种结合社交信任关系、用户特征的GNN模型，通过GAT处理用户多维度信息，解决社交信任评估中的复杂性。实验结果显示在OSNs中，GATrust优于Guardian、Matri和Tidaltrust，提升了F1-score和MAE性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GATrust: A Multi-Aspect Graph Attention Network Model for Trust Assessment in OSNs

（TKDE 2023）

采用数据集：

在这里插入图片描述

一、提出问题

GNN的出现为信任评估开辟了一条新方法，然而，用户特征（比如个人爱好和职业）没有被考虑进去，当面临社交信任的多层次属性时，仅仅使用GCN的解决方案很难去探索到社交信任评估所要求的丰富的嵌入信息。

二、解决方案

提出了一个新的考虑到社交信任关系和用户特征的信任评估模型GATrust，采用GAT去计算用户的多重属性（包括网络拓扑结构、用户特征和社交信任关系）的注意力系数。第一层采用GAT而高层全采用GCN，这样也可以利用社交网络上的信息传播与聚合规则融合到高阶节点的信息。为了解决信任的不对称问题，GNN层分为两个部分，信任流行度聚合（入度）和信任热情度聚合（出度），最后再拼接用于预测两个用户之间的信任值。

三、具体过程

在这里插入图片描述

1. Network Embedding Layer

采用embedding分别表示每个用户的特征、已知的社交信任关系以及在网络拓扑结构的特征信息。对于用户特征，将用户的兴趣和爱好分为8类，采用one-hot编码。对于已知的社交信任关系，仍然采用one-hot编码表示，对于网络拓扑结构的特征信息，采用Node2vec去映射为一个 $D_e$ 维的向量。然后这些向量将被送入GNN层。

2. Multiple GNN layers

为了获得用户 $x$ 的潜在embedding向量 $l [x]$ ，首先考虑到信任的非对称性，因此 $l [x]$ 包含两个内容 $l_I[x]$ 和 $l_O[x]$ ，分别表示信任流行度（用户被信任的embedding）和信任热情度（信任别人的embedding）。第一层为GAT而高层都为GCN。具体方法如下：

通过GAT聚合信任流行度embedding：
在这里插入图片描述

首先用线性转换将用户特征的one-hot向量和信任评分的one-hot向量（论文给出的数据集中将信任评分分为4类，因此也是4维的one-hot向量）转换为 $D_e$ 维的稠密向量：
$f[x]=W_xc[x]$

$T_{w_{x\leftarrow y}}=W_{x\leftarrow y}T_{yx}$

其中， $W_x$ 和 $W_{x\leftarrow y}$ 都是可训练参数。

假定 $T_{f_I[x]}$ , $T_{u_I[x]}$ 和 $T_{g_I[x]}$ 分别为用户 $x$ 的用户特征、拓扑结构特征和信任评级特征的聚合，那么
$T_{f_I[x]}=\sum_{y\in Adj_I(x)}\alpha_{x\leftarrow y}^Ff[y]$

$T_{u_I[x]}=\sum_{y\in Adj_I(x)}\alpha_{x\leftarrow y}^Uu[y]$

$T_{g_I[x]}=\sum_{y\in Adj_I(x)}\alpha_{x\leftarrow y}^ST_{w_{x\leftarrow y}}$

其中， $Adj_I(x)$ 表示信任用户 $x$ 的邻居集合，采用如下公式得到注意力系数：
$\alpha_{x\leftarrow y}^F=\frac{exp(\sigma(\alpha_{IF}^T[W_{IF}f[x]\otimes W_{IF}f[y]]))}{\sum_{k\in Adj_I(x)}exp(\sigma(\alpha_{IF}^T[W_{IF}f[x]\otimes W_{IF}f[k]]))}$

$\alpha_{x\leftarrow y}^U=\frac{exp(\sigma(\alpha_{IU}^T[W_{IU}u[x]\otimes W_{IU}u[y]]))}{\sum_{k\in Adj_I(x)}exp(\sigma(\alpha_{IU}^T[W_{IU}u[x]\otimes W_{IU}u[k]]))}$

$\alpha_{x\leftarrow y}^S=\frac{exp(\sigma(\alpha_{IT}^T[W_{IT}u[x]\otimes W_{IT}T_{w_{x\leftarrow y}}]))}{\sum_{k\in Adj_I(x)}exp(\sigma(\alpha_{IT}^T[W_{IT}u[x]\otimes W_{IT}T_{w_{x\leftarrow k}}]))}$

其中， $\otimes$ 表示拼接操作， $\sigma$ 为leakRelu激活函数。

然后得到 $l_I[x]=T_{f_I[x]}\otimes T_{u_I[x]} \otimes T_{g_I[x]}$ ，同理可以得到 $l_O[x]$ 。

最终通过第一层的GAT可以得到用户 $x$ 的向量表示为：
$l[x]=\sigma(W(l_I[x]\otimes l_O[x])+b)$
通过GCN进行高阶的信任传播：
在这里插入图片描述

在第 $h$ 层，对于用户 $x$ 而言，以信任流行度embedding为例（入度），如果用户 $y$ 信任 $x$ ，那么传播为：
$l^h[x\leftarrow y]=l_I^{h-1}[y]\otimes W_{x\leftarrow y}^h\cdot T_{yx}$
聚合过程为：
$l_I^h[x]=\frac{1}{|Adj_I(x)|}\sum_{y\in Adj_I(x)}l^h[x\leftarrow y]$
同理可以得到 $l_O^h[x]$ ，经过多层之后的最终用户embedding表示为：
$l^h[x]=\sigma(W^h(l_I^h[x]\otimes l_O^h[x])+b^h)$

3. Output layer

对于一对未知的用户对，其预测信任评级为：
$\overline{l}[x\rightarrow y]=\sigma(W_{FC}\cdot(l^h[x]\otimes l^h[y]))$
$\overline{l}[x\rightarrow y]$ 为一个概率向量，判断预测关系属于数据集中的哪一类， $\sigma$ 为softmax函数。

4. 算法伪代码

四、实验结果

采用F1-score和MAE指标，对比模型为Guardian、Matri和Tidaltrust，结果如下：

在这里插入图片描述