1、现实世界的图
在现实世界中,很多地方都会用到图。比较常见的图有:
- 社交网络:比如人与人之间的社交关系,人就是节点,是否存在联系就是是否有边
- 影响力传播:比如病毒的传播
- 知识图谱(语义网络):由节点、边和标签组成,通常存储于图数据库中
- 推荐系统:将用户看成子图,商品看成另一个子图,寻找这两个子图之间的关系
- 蛋白质分子:在生物化学里,蛋白质分子就是图结构
2、机器学习在图上的应用
2.1 图机器学习的功能分类
图是由节点和边组成的,因此有关图的所有任务都是围绕着节点、边或者整图。根据目的的不同,机器学习在图上的应用可以大概分为这几类:
- 节点预测:预测节点的类别或者节点的某个属性的值
- 链接预测:预测两个节点直接是否存在链接
- 整图预测:对整图进行分类或者是预测整图所具有的属性
- 节点聚类:检测节点是否能形成一个社区
- 图生成:在理解和学习现有的图数据分布,并合成新的图样本
- …
2.2 机器学习在图上应用的挑战
由于图具有特殊的属性:
- 任意的大小和复杂的拓扑结构;
- 没有固定的节点排序或参考点;
- 通常是动态的,并具有多模态的特征;
- 图的信息并非只蕴含在节点信息和边的信息中,图的信息还包括了图的拓扑结构。
因此要求能够应用在图上的机器学习方法具有如下的能力:
- 适用于不同度的节点;
- 节点表征的计算与邻接节点的排序无关;
- 不但能够根据节点信息、邻接节点的信息和边的信息计算节点表征,还能根据图拓扑结构计算节点表征。