【论文解读】GRAPH-BERT: Only Attention is Needed for Learning Graph Representations

最新推荐文章于 2024-12-24 15:20:09 发布

JHao的学习屋

最新推荐文章于 2024-12-24 15:20:09 发布

阅读量915

点赞数 30

文章标签： bert 人工智能深度学习算法

本文链接：https://blog.csdn.net/m0_68989328/article/details/144474992

版权

Graph-BERT 是一种基于 Transformer 的图神经网络，旨在解决传统 GNN 模型中的过平滑 (over-smoothing) 和悬置动画 (suspended animation) 问题。本文详细介绍其模型结构和核心公式。

在这里插入图片描述

Graph-BERT 的整体架构包括以下五部分：

Graph-BERT 从全局图中采样无连接的子图来处理大型图。具体步骤：

子图定义：
- 给定节点 ( v_i )，根据亲密度矩阵 ( S ) 选择与 ( v_i ) 亲密度最高的 ( k ) 个节点 ( \Gamma(v_i) )。
- 子图定义为 ( g_i = (V_i, \emptyset) )，其中 ( V_i = {v_i} \cup \Gamma(v_i) )。
公式：
$\alpha \cdot (I - (1-\alpha) \cdot \bar{A})^{-1}$
- ( S )：节点间的亲密度矩阵。
- ( \bar{A} = A D^{-1} )：归一化的邻接矩阵。
- ( \alpha )：平衡因子（通常取 ( 0.15 )）。

这种采样方式允许模型在大规模图数据上实现高效并行化。

Graph-BERT 为每个节点生成以下四种特征嵌入：

Raw Feature Vector Embedding (原始特征嵌入)：
- 将节点的原始特征 ( x_j ) 嵌入共享特征空间。
  $e_j^{(x)} = \text{Embed}(x_j), \quad e_j^{(x)} \in \mathbb{R}^{d_h \times 1}$
Weisfeiler-Lehman Absolute Role Embedding (WL 绝对角色嵌入)：
- 使用 WL 算法为节点分配角色代码 ( \text{WL}(v_j) )，并通过正弦和余弦函数生成嵌入。
  $e_j^{(r)} = \text{Position-Embed}(\text{WL}(v_j))$
  $e_j^{(r)} = \left[ \sin\left(\frac{\text{WL}(v_j)}{10000^{\frac{2l}{d_h}}}\righ$