node2vec算法可以看成deepwalk算法的一种改进,它综合了DFS领域和BFS领域的一种graph embedding方法。
算法原理
对于图G(V,E),node2vec优化的目标函数是:
为了简化上述式子,引入两个假设:
第一个假设是说,在给定源顶点下,其近邻目标节点出现的概率与近邻集合的其余节点无关;第二个假设表明,一个顶点无论是作为源节点还是目标节点,其代表的embedding向量一致,这一点与LINE算法的假设不一样。根据这两个假设,目标函数简化为:
Z是归一化因子,通常计算复杂,因此采取负采样去近似。对于上述目标函数,采取异步随机梯度上升法去求解embe