图机器学习导论
前言
传统机器学习的数据样本之间存在独立同分布的关系,也可认为“样本之间无关联”。在执行分类或回归任务时,仅需完成拟合决策边界或分布曲线的工作即可。这些“样本之间无关联”的应用场景可以使用经典的全连接神经网络、卷积神经网络、循环神经网络、Transformer等方法。对于“样本之间无关联”的应用场景,可将样本转换为不包含“关联关系”的节点与包含“关联关系”的边这两个部分,然后利用图神经网络来解决“样本之间存在关联”的问题。
一、图神经网络的特点
- 输入尺寸任意、拓扑结构复杂;
- 无固定节点顺序、无参考锚点;
- 图结构动态变化、多模态特征。
二、图神经网络的流程
1.整体流程
无需人工特征工程,通过端到端的表示学习来实现自动学习特征。
2.表示学习
表示学习是将节点表示为d维向量(包含节点的链接关系)
3.常用场景
- 最短路径搜索
- 节点重要度分析
- 社群检测
- 关系预测
- 相似度分析
- 图嵌入(表示)
4.任务层次类型
- 节点层任务
- 连接层任务
- 社群(子图)层面任务(聚类)
- 图层面任务(图预测、图生成)
5.任务分类
- 节点分类
- 连接预测
- 图分类
- 聚类
- 社群检测
- 异常检测