目录
MetaPath2vec
在异构图中,不同类型的节点和边具有不同的语义含义。因此,对于异构网络嵌入,不仅要关注节点之间的结构相关性,还要关注节点之间的语义相关性。metapath2vec (Dong et al., 2017)被提出来捕捉节点之间的这两种相关性。接下来,我们详细介绍metapath2vec (Dong et al., 2017)算法,包括其提取器、重构器和目标。注意,metapath2vec中的映射函数与DeepWalk相同。
1.基于元路径的信息提取器
为了同时捕获结构和语义相关性,引入了基于元路径的随机游走来提取共现信息。
定义一个元路径,其中A是各种类型的节点,R是各种类型的边。而一个元路径遵循的元路径模式,即元路径的节点和边的类型都遵循一个元路径模式对应的节点的类型和变得类型。
通过元路径模式来引导随即游走。而每一个元路径都是基于这个模式下随机游走的实例。
因此定义以元路径模式随机游走的概率可以表示为
(1)
其中表示元路径中节点类型
的节点
表示
的邻域集合中节点类型为
,并且与节点
通过类型为
的边连接的节点
。可以表示为:
按照(1)中的概率生成元路径模式下的随机游走后,按照deepwalk中的共现抽取器来抽取元组(vcon,vcen)共现表。
2.重构器
通常一般又两种重构器,一个是和DeepWalk中的重构器一样的。另一个是为每一种节点类型定义一个多项分布式而不是所有节点上单一分布。
对于一个节点类型为nt的节点,则从给点给节点观察到
的概率为:
(2)
其中是所有节点类型为nt的节点集合。
3.构造目标
可以采用以上两种重构器后在根据deepwalk的方法构造目标