GraphTrans:Representing Long-Range Context for Graph Neural Networks with Global Attention

最新推荐文章于 2024-06-25 09:41:23 发布

lgcnongchaoer

最新推荐文章于 2024-06-25 09:41:23 发布

阅读量1.9k

点赞数 2

文章标签：神经网络 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lgcnongchaoer/article/details/123864655

版权

一、论文基础信息

论文题目：Representing Long-Range Context for Graph
Neural Networks with Global Attention
论文来源：NIPS2021
论文作者：Zhanghao Wu, Paras Jain, Matthew A. Wright, Azalia Mirhoseini, Joseph E. Gonzalez, Ion Stoica
论文链接：点击跳转
作者团队：Joseph E. Gonzalez, Ion Stoica from UC Berkeley
论文源代码：点击跳转

二、论文内容总结

Motivation

基于GNNs的模型难以解决长期依赖问题，GNNs过深或过宽会导致梯度消失和过度平滑问题，而在CV中广泛使用的池化方法还未在GNNs中使用

论文贡献

通过Transformer进行long-rang reasoning可以提高GNNs的准确性，且实验结果证明，对图中所有的pairs node-node interaction进行建模对于大型图分类任务尤为重要；
设计了一种新颖的GNNs readout模块，使用一个特殊的"" token来将所有的pairs interaction聚合为一个分类向量。
GraphTrans在OGB和NCI生物分子数据集上取得了sota的表现

算法设计

模型结构
在这里插入图片描述
公式推导
1、通用的GNN layer表示为：
$h_v^l=f_l(h_v^{ \mathcal{l} -1}, {h_u^{l-1}|u \in \mathcal{N}(v)})\quad l=1,...,L_{GNN}$
其中， $L_{GNN}$ 为GNN的总层数， $\mathcal{N}(v)\in\mathcal{V}$ 为节点 $v$ 的邻居节点。

2、将GNN最后一层的输出 $h_v^{L_{GNN}}$ 通过Linear和LayerNorm后，作为Transformer的输入：

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。