【网络表示学习】Deepwalk

最新推荐文章于 2022-03-25 09:30:57 发布

zjwreal

最新推荐文章于 2022-03-25 09:30:57 发布

阅读量375

点赞数

分类专栏：网络表示学习网络表示学习文章标签： Network Embedding 表示学习

本文链接：https://blog.csdn.net/zjwreal/article/details/88094458

版权

网络表示学习同时被 2 个专栏收录

16 篇文章 3 订阅

订阅专栏

网络表示学习

15 篇文章 2 订阅

订阅专栏

题目：Deepwalk: Online learning of social representations

作者：Perozzi, Bryan and Al-Rfou, Rami and Skiena, Steven

来源：KDD 2014

源码：https://github.com/phanein/deepwalk

模型

short random walks = sentence

word2vec在训练词向量时，以文本语料作为输入数据；网络表示学习以复杂信息网络作为数据输入。在训练过程中词语出现的频次与根据原始网络结构进行随机游走时顶点被访问到的次数两者均服从幂律分布。

DeepWalk方法很简单，就是以某一特定点为起始点，做随机游走得到点的序列，然后得到的序列视其为句子，用word2vec来学习，得到该点的表示向量。

类比	word2vec	deepwalk
输入数据	语料库	短的随机游走序列集合
输入数据	词汇表	节点集合
	词语出现的频次服从幂律分布	随机游走时顶点被访问到的次数服从幂律分布
		不考虑窗口中上下文节点到中心节点的距离的影响，只关心与中心节点是否同时出现。

Random Walks

对于每个节点产生 y个游走（相当于 $\gamma$ 个epoch）；每一轮游走中所有节点都进行一次随机游走。对于每个节点 $v_i$ ，产生长度为 $t$ 的随机游走 $W_{v_i}$ 来更新表示。使用SkipGram算法更新。

Hierarchical Softmax

计算 $P(v_3 | \Phi(v_1))$ 复杂度为 $O (∣ V ∣)$ ，太耗时。考虑将图节点作为二叉树的叶子节点，最大化 $P(v_3 | \Phi(v_1))$ 等价于最大化从根节点到节点 $v_3$ 的路径的概率。如上图中从根节点到 $v_3$ 节点的路径为 $b 1, b 2, b 5$ ，将这些节点对应的概率乘积算出
$P(v_3|\Phi(v_i)) = \frac{1}{(1+ e^{-\Phi(v_1) * \Psi(b1)}) (1+ e^{\Phi(v_1) * \Psi(b2)}) (1+ e^{-\Phi(v_1) * \Psi(b5)})}$
假设从左边是正例，从右边是负例； $\Psi(b1)$ 是 $b 1$ 的隐含表示；原式复杂度降为 $O (l o g ∣ V ∣)$

为什么计算 $P(v_3 | \Phi(v_1))$ 复杂度为 $O (∣ V ∣)$

计算 $P(v_3 | \Phi(v_1))$ 使用多项逻辑斯蒂回归需要所有节点参与复杂度为O(|V|)

训练过程

学习参数

节点表示
树的二分类器的权重

步骤

随机初始化表示
对于二叉树每个非叶子结点计算loss函数
使用随机梯度下降法同时更新二分类器的权重和节点表示

实现

作者的代码实现中只对图进行随机游走生成语料库，作为输入给word2vec

算法

算法由两部分组成：（1）随机游走生成器（2）更新步骤

外循环：对于每个节点产生 y个游走

内循环：对于每个节点 $v_i$ ，产生长度为 $t$ 的随机游走 $W_{v_i}$ 来更新表示。使用SkipGram算法更新。

$t$ 为每次随机游走的长度，这样后续构造出来的所有序列都是等长的。

$\gamma$ 为每个点作为随机游走序列起点的次数

问题

为什么说明图的随机游走节点访问频率与语言模型中单词频率都符合幂律分布就说明二者近似？
对于新加入节点，怎么得到其表示？
参数设置：窗口大小等

zjwreal

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【网络表示学习】Deepwalk

Deepwalk: Online learning of social representations，KDD 2014模型short random walks = sentenceword2vec在训练词向量时，以文本语料作为输入数据；网络表示学习以复杂信息网络作为数据输入。在训练过程中词语出现的频次与根据原始网络结构进行随机游走时顶点被访问到的次数两者均服从幂律分布。DeepWalk方...
复制链接

扫一扫

专栏目录