概览
对有向图的节点进行embedding。
对于每个顶点,的到两个embedding后的向量,一个是source,一个是target。因为是有向图,此顶点可能是一条路径的源头,也有可能是一条路径的终点。
方法
论文的核心目的是:
其中s是相似矩阵,也就是Sij是source顶点i和target顶点j的相似度。U自然分别是source顶点和target顶点分别embedding后的向量矩阵。
对于找出S,论文给出了集中已经存在的方法:
- Katz Index
- Rooted PageRank (RPR)
- Common neighborhood
- Adamic-Adar (AA)
具体每一种方法就不再解释,但的到的矩阵S都是两个顶点的相似度。
论文参考已有的研究,认为:
也就是S可以用奇异值分解来得到U:(这里u和v看成一样的)
由于先求s在对s进行svd对大数据不太友好,因此作者使用了以下方法:
首先,求s的四种方法都可以写成以下式子:
- Katz Index
- Rooted PageRank (RPR)
- Common neighborhood
- Adamic-Adar (AA)
因此s的svd变成了:
根据已经有的研究,可以用generalized SVD来代替original SVD,也就是可以不求s直接进行SVD
集体的方法就不再探究,可以看原作者和作者引用的论文。
总结
对有向图进行嵌入
每个顶点嵌入成两个向量