Task08 总结
-
基本的图论知识、常规的图预测任务和PyG库的安装与使用:
在这一任务中,推荐大家用mini-conda的集成环境,如果使用纯pip环境,所使用的系统需要是Linux或Mac。 -
实现图神经网络的通用范式,构建一个图神经网络:
在这一任务中,主要了解MessagePassing
基类的运行流程,建议通过断点调试的方式,掌握propagate()
、message()
、aggregate()
和update()
函数的调用顺序与相关功能。 -
基于图神经网络的节点表征:
在这一任务中,主要学习GCN
和GAT
两个经典的图神经网络,并通过与MLP
比较,得到共同点和区别(归一化方法)。 -
基于PyG的内存数据集构建和节点/边预测任务实践:
在这一任务中,主要学习如何构建一个Data
类,其中通过PlanetoidPubMed数据类,了解构建数据集的流程(下载、生成对象、执行数据处理、过滤对象、保存文件);边预测任务主要思路是生成负样本,使得正负样本数量平衡,通过使用两层GCNConv
神经网络进行边预测,了解边预测的流程。 -
超大图上的节点表征:
在这一任务中,主要学习在超大图上的一种节点表征方法Cluster-GCN
,了解基本步骤(分簇、近似邻接矩阵、簇采样并更新参数)、时间/空间复杂度和节点表征利用率。 -
基于图神经网络的图表征学习方法:
在这一任务中,主要学习图同构网络(GIN)的基本思路(计算节点表征、图池化、线性变换),并了解WL Test的图同构测试方法基本步骤(迭代标签、散列标签、比较WL子树)、图相似性评估方法(WL Subtree Kernel方法:WL Test方法得多层标签、统计次数、向量表示、向量内积)。 -
图预测任务实践:
在这一任务中,主要学习将图样本封装成batch和DataLoader
类的方法,使用小图邻接矩阵存储在对角线,复写__inc__()
和__cat_dim__()
方法,实现节点序号增值和新维度拼接。
参考资料
[DataWhale开源资料](Datawhale/team-learning-nlp - Gitee)