Jure Leskovec的《Graph Representation Learning》可能是迄今(2019年10月)为止最容易理解的图神经网络分享。它提出并回答了为什么要进行图表示,如何进行图表示等一系列根本性问题,而图神经网络仅仅是图表示学习的高阶版本。
这里我就复刻一下Leskovec的素材及思路,再增加一些解读及实现细节,汇成一个系列教程。
为什么要研究图(graph)
很多数据都是图结构,例如社交网络、经济网络、生物医学网络、信息网络(互联网网站、学术引用)、互联网、神经网络。而网络是它们的通用语言,因此具备极大的研究价值。
针对图结构的机器学习任务
一旦我们拥有了图结构的数据,就可以做一下潜在的机器学习任务,例如:
- 节点分类 ——预测一个给定节点的类型
- 链接预测 ——预测两个节点是否连接
- 社群检测 ——识别密集连接的节点群
- 网络相似度 ——两个子网络有多相似
等等。
然而,正如我们所熟知的,机器学习任务的基本流程如下所示: