IJCAI 2022 | 超越同质性的图神经网络

19369807ecf24b4f2228ee68965014af.gif

©作者 | 焦子豪

单位 | 南京邮电大学

来源 | MIND Laboratory

4b94ddf9f58cefe9f354e527ad28ebf3.png

论文标题:

Beyond Homophily: Structure-aware Path Aggregation Graph Neural Network

收录会议:

IJCAI 2022

论文来源:

http://yangy.org/works/gnn/IJCAI22_Beyond.pdf


5950f5000eee78030b3bda98424c415a.png


论文介绍

图神经网络 (GNNs) 已经在许多现实世界任务中得到了广泛研究与应用。然而,GNN 基于同质性的假设限制了其在异质图上的表示学习能力。本文聚焦于图上的路径,用来表示丰富的语义和结构信息。本文提出了路径聚合图神经网络 Path Aggregation Graph Neural Network (PathNet),旨在将 GNN 同时推广到同质图和异质图上。

5b450754f9776857ad1a4afefd3e60d7.png


论文动机

尽管 GNN 在大多数任务上取得了良好的结果,大部分 GNN 是基于同质性的条件设计出来的。也就是说,相连接的结点对倾向于拥有相似的特征,或属于同种类别(“birds of a feather flock together”)。然而,现实世界中有很多图并不具有同质性,表现出“异性相吸”的特点。

e9dd02066345d23c5030e0136eb1bccd.png

如图所示,a 和 b 分别表示的是同质图和异质图。在异质图中,相邻的结点可能拥有不同的特征,或属于不同的类别。如 c 所示,在异质图 b 中,要生成结点 0 的表示,需要首先对结点 1 和 2 的表示进行学习。

对于结点 1,聚合其周围邻居 0、3、4,对于结点 2,聚合其周围邻居 0、5、6。会发现结点 1 和 2 聚合以后的特征是同样的:

abd2fd90acd0ee31efd5339996d0f44c.png

这对于结点 0 来说是无法区分的。然而结点 1 和 2 的原始特征是不同的,这表明 GNN 聚合操作对于异质图的缺陷性。

然而本文提出的图上的路径模式能够很好的对同质图和异质图进行建模。如图 d,本文提出的方法聚合了三种路径,分别通过结点 1、3;1、4;2、5/6 生成。

dae7f55f741346adb221a2557363fef3.jpeg

本文的贡献概括如下:

1. 提出了路径聚合模式,用于捕获同/异质图的结构信息;

2. 设计了 end-to-end 模型 PathNet,对路径的次序和距离信息进行编码,以获得丰富的语义信息;

3. 实验结果表明本文的方法在异质图上取得了 SOTA 的结果,在同质图上取得了 competitive 的结果。

63b34d11d393691b176cddf7299e8e01.png


PathNet

cedac5757fe67d1467b3c4394c00b374.png

209a54a8d45edf971a4ba294e4da3cd4.png

3.1 Maximal Entropy Path Sampler

有别于传统的随机游走,本文采取基于最大熵的随机游走,对路径进行采样。这样的随机游走每一步保持熵增,同时引入向量中间性作为衡量结点重要程度的指标:

44c00352a917fec842c75e6950504b38.png

其中, 是随机游走的最大熵, 是平稳分布。

3.2 Structure-aware Path Aggregator

本文设计了一个路径聚合器,用于聚合路径信息。同时设计了一个循环单元,对路径嵌入编码,以结合路径中各结点的次序和距离信息。

78955d2a75eb1128ab30a2a85959f52e.png

如图所示,本文采取的路径聚合策略能够弥补传统 GNN 面对异质图的无力。与传统的各自对各层的结点进行聚合不同,本文提出了循环单元,对路径序列进行编码,以保留每个结点的次序信息:

5493703e1bb40c8f415944eb5e92e43f.png

其中 是所有结点的特征,是结点嵌入, 和 是可学习的参数, 是激活函数。

本文设计循环单元 为:

49f7fb471e4af5be7448b8ead20e7794.png

其中 表示结点 v 在路径第 j 步的潜在嵌入。 分别表示输入、遗忘、输出门。

本文为每个结点设计了路径偏好 (path preference),即学习不同路径对于目标结点聚合的重要性。本文计算偏好系数如下:

39f60094bc669d4852e13a28569e6231.png

其中 是可训练的权重参数, 是经式 4 计算得出的路径 p 的嵌入, 是目标结点的嵌入。 LeakvReLU。

最后将偏好系数作为路径权重,对结点 v 进行预测:

9123877e1036a33aeac1da23c90ce0b8.png

13cc9337737d492a0b2433975bbfa631.png


实验

0aed1ff2aef3aa1de59401bc82b5081f.png

本文采取了 7 个真实世界数据集:3 个同质(绿色)& 4 个异质(黄色)。可以看出 PathNet 在所有的异质图数据集上均取得了 SOTA 的结果,在同质图数据集上也有优越的性能。

2d2ee180602e92cd6b40a9d89704addc.png

在人工数据集上取得了 SOTA 的结果。

a74cefa0f097e49aec5b5b7b281cf4a1.png

总结

本文提出了采用路径对图中结点进行聚合的方法 PathNet,能够同时捕获同/异质图中的语义和结构信息。首先采用最大化熵对路径进行采样;接着采用循环单元对每条路径进行基于结构的聚合;然后对路径偏好进行处理。作为 end-to-end 的模型,PathNet 在同质图和异质图上均取得了 SOTA 的结果。

更多阅读

e0fe7b728c2e558470ad55d22926e09c.png

f0ca0789526a1208a009c3b96e7e8bf8.png

979203c479c227c30dd0bdc9e364e9f9.png

cbd6857dcfe64efb40f2a680260aee0f.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

faf36d24db43994cc113e8164972b5bf.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

1d5327d7a252ff08bf406a222e53cfb2.jpeg

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值