图神经网络实战(3)——基于DeepWalk创建节点表示
0. 前言
DeepWalk
是机器学习 (machine learning
, ML
) 技术在图数据中的成功应用之一,其引入了嵌入等重要概念,这些概念是图神经网络 (Graph Neural Network
, GNN
) 的核心。与传统的神经网络不同,这种架构的目标是产生表示 (representations
),然后将其传递给其他模型执行下游任务(例如节点分类)时使用。
在本节中,我们将了解 DeepWalk
架构及其两个主要组件: Word2Vec
和随机游走 (random walks
)。首先介绍 Word2Vec
架构的工作原理,并重点介绍 skip-gram
模型,并在自然语言处理 (natural language processing
, NLP
) 任务中使用 gensim
库实现 skip-gram
模型,以了解其使用方法。然后,我们将重点研究 DeepWalk
算法,学习如何使用分层 softmax
(hierarchical softmax
, H-Softmax
) 提高性能。然后在图上实现随机游走,最后使用 “Zachary’s Karate Club
” 数据集实现一个端到端的监督节点分类模型。
1. Word2Vec
理解 DeepWalk
算法的第一步是