图算法
图游走类算法
NLP领域: Word2vec
参考文章: 《Word2vec: Distributed Representations of Words and Phrases and their Compositionality》
图游走类模型最开始参考的就是 NLP 领域中的 Word2vec 模型。
词的语义由其上下文决定。
Skip Gram:根据中心词预测上下文
Negative Sampling
假设,给定中心词 orange,我们要预测其上下文词中的 juice。
计算词表内所有单词的概率 -> 计算量大
由于负样本的数量一般远远大于正样本的数量,这里对负样本进行采样,以达到类别平衡,并减少计算量。只对正样本和选取的负样本进行分类,从而减少计算量:
图嵌入领域
通常,图中的节点会受其邻居的影响。
图游走类模型——DeepWalk
参考文章:《DeepWalk: Online Learning of Social Representations》
将 NLP 领域的思想运用到图(网络)嵌入领域。
游走方式:Random Walk
整体架构:
node2vec: 对 DeepWalk 的改进
参考文章:《node2vec: Scalable Feature Learning for Networks 》
- bias random walk
整体架构:
异构体随机游走
metapath2vec
参考文章:《metapath2vec: Scalable Representation Learning for Heterogeneous Networks》
异构体定义:
节点和边有不同类型
元路径:meta path
基于meta path 的随机游走
整体框架:
变种:multi-metapath2vec++
变种:side info+multi-metapath2vec++
总结
参考
-
斯坦福CS224W课程: http://cs224w.stanford.edu