参考资料:
1. DeepWalk论文原文https://dl.acm.org/citation.cfm?doid=2623330.2623732
2. 论文Slides及第一作者在KDD上的口头报告视频:http://videolectures.net/kdd2014_perozzi_deep_walk/
DeepWalk主要思想:
将在一个网络上随机游走的路径(由节点组成)等同于一句自然语言。通过一定策略游走的所有路径组合在一起当做是语料库。然后就可以使用自言语言处理技术来进行网络表示学习,而DeepWalk这篇文章就用了word2vec技术。
首先,为什么DeepWalk能用word2vec或者能用自然语言处理技术来进行网络表示学习?
上图是作者分别针对随机游走路径上的节点和自然语言里的词频的一个分析:即都存在统一的幂率特性。那么,什么叫做幂率特性呢?在自然语言里面,可以理解为只有少量的单词出现频率非常高,而绝大部分的单词出现的频率较低。还可以理解为,在日常交流中,常用的词汇很少,而绝大部分的词汇并不常用,由此&#x