word2vec是将词变成向量,顾名思义,node2vec其实就是将复杂网络中的节点变成向量。其核心思想为:生成随机游走,对随机游走采样得到(节点,上下文)的组合,然后用处理词向量的方法对这样的组合建模得到网络节点的表示。
Deepwalk和node2vec的思想是高度一致的。相比于deepwalk,node2vec在生成随机游走过程中做了一些创新。这里我们不对两者进行深入比较,但由此提出一个结论,也请出今天的二号主角,这一类编码方式的核心结构:我个人把它看做是“上、下”结构
上:想尽一切办法,在你的网络中进行游走,并采集成序,具体什么游走策略取决于你想采集到什么信息。
下:将采集好的序当作文本,后续与处理词向量的方法相似。