【图嵌入】DeepWalk原理与代码实战

最新推荐文章于 2024-09-15 21:14:03 发布

VariableX

最新推荐文章于 2024-09-15 21:14:03 发布

阅读量5.2k

点赞数 7

分类专栏：图嵌入文章标签： DeepWalk random walk 图嵌入实战 Embedding

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/VariableX/article/details/108984600

版权

DeepWalk借鉴word2vec的思想，通过随机游走生成节点序列，利用skip-gram模型学习节点的向量表示。代码实现包括构造图、随机游走和嵌入三个步骤，能有效捕获图中节点的局部上下文信息，适用于大规模图的并行化处理和局部适应性变化。

摘要由CSDN通过智能技术生成

DeepWalk

基础理论

了解过 NLP 的同学对 word2vec 应该不陌生，word2vec 通过句子中词与词之间的共现关系来学习词的向量表示，如果你忘记了，可以看看我之前的博客：

DeepWalk 出自论文：DeepWalk: Online Learning of Social Representations，它的思想与 word2vec 类似，从一个初始节点沿着图中的边随机游走一定的步数，将经过的节点序列视为句子。那么，从不同的起点开始的不同游走路线就构成了不同的句子。当获取到足够数量的句子（节点访问序列）后，可以使用 skip-gram 模型对每个节点学习其向量表示。这个过程如下图所示：

在这里插入图片描述

以下是对 DeepWalk 的一些思考与个人理解：

DeepWalk 利用类似深度优先遍历的方式将复杂的图结构转换为序列，进而实现节点的Embedding。这个遍历的过程相当于对图中的节点进行采样，捕获局部上下文信息。上图中B与D都是A与E共有的邻居，那么在经过节点Ｂ、Ｄ的随机游走序列中，节点Ａ或者节点Ｅ出现的频率也比较高，说明节点A和E具有相似的上下文语境，那么A和E的Embedding表示也应该相似。

下面再来看个更直观的例子，如下图中的节点1、4是节点2、3共有的邻居：

在这里插入图片描述

那么在经过节点1、4的随机游走序列中，节点2或者节点3出现的频率也比较高，例如：

0，4，3
0，4，2
1，2
1，3
1，4，3
1，4，2
…

那么根据 skip-gram 模型的思想，节点2，3的局部上下文语境比较相似，于是最终学习到的节点2、3的Embedding表示也就比较相似。这也意味着，当两个节点共

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。