在图节点预测或边预测任务中,首先需要生成节点表征(representation)。高质量节点表征应该能用于衡量节点的相似性,然后基于节点表征可以实现高准确性的节点预测或边预测,因此节点表征的生成是图节点预测和边预测任务成功的关键。基于图神经网络的节点表征学习可以理解为对图神经网络进行基于监督学习的训练,使得图神经网络学会产生高质量的节点表征。
我们将以Cora
数据集为例子进行说明,Cora
是一个论文引用网络,节点代表论文,如果两篇论文存在引用关系,那么认为对应的两个节点之间存在边,每个节点由一个1433维的词包特征向量描述。我们的任务是推断每个文档的类别(共7类)
为了展现图神经网络的强大,我们通过节点分类任务来比较MLP和GCN, GAT(两个知名度很高的图神经网络)三者的节点表征学习能力。此节内容安排为:
- 首先,我们要做一些准备工作,即获取并分析数据集、构建一个方法用于分析节点表征的分布。
- 然后,我们考察MLP用于节点分类的表现,并分析基于MLP学习到的节点表征的分布。
- 接着,我们逐一介绍GCN, GAT这两个图神经网络的理论、他们在节点分类任务中的表现以及它们学习到的节点表征的分布。
- 最后,我们比较三者在节点表征学习能力上的差异。