写在最前
来总结一下最近几周看的图编码算法,还蛮有意思的。
图算法:
1.经典数据结构与算法层面:最小生成树(Prim,Kruskal,…),最短路(Dijstra,Floyed,…),拓扑排序,关键路径等;
2.概率图模型,涉及图的表示,推断和学习,Koller的书/公开课;
3.图神经网络,主要包括Graph Embedding (基于随机游走)和Graph CNN(基于邻居汇聚)两部分。
图编码:
Graph Embedding技术将图中的节点以低维稠密向量的形式进行表达,要求在原始图中相似(不同的方法对相似的定义不同)的节点在低维表达空间也接近。得到的表达向量可以用来进行下游任务,如节点分类,链接预测,可视化或重构原始图等。
基于随机游走的图编码算法:
Deepwalk 构建同构网络,从每个节点开始分别进行random walk采样,得到局部相关联的训练数据;对采样数据进行skipGram训练,将离散的网络节点表示成向量化,最大化节点共现,使用Hierarchical Softmax来做超大规模分类的分类器。
将截