随机游走
幂律分布
前提: 如果一个网络的节点服从幂律分布,那么节点在随机游走序列中的出现次数也服从幂律分布,并且实证发现NLP中单词的出现频率也服从幂律分布。
DeepWalk算法
DEEPWALK(G,w,d,γ,t);G代表网络,w代表窗口大小,d达标维度,γ代表每个顶点随机游走的次数,t代表随机游走的步长
Input:G(V,E);G代表网络,V代表网络中的节点,E代表网络中的边
output:|V|*d的矩阵,每一个顶点都有一个d维的连续向量
1.初始化每个顶点的向量空间
2.建立Huffman树(根据随机游走顶点出现的次数构建)
3.0- γ(表示随机游走 γ次)(进入循环)
4.将V打乱顺序得到O
5.遍历O中的每一个顶点,do(进入循环)
6.得到从vi节点