2017 KDD | metapath2vec: Scalable Representation Learning for Heterogeneous

2017 KDD | metapath2vec: Scalable Representation Learning for Heterogeneous Networks

Paper: https://ericdongyx.github.io/papers/KDD17-dong-chawla-swami-metapath2vec.pdf
Code: https://ericdongyx.github.io/metapath2vec/m2v.html

2017 KDD | metapath2vec:异构网络可扩展表示学习

作者提到了当前已经提出的采用了word2vec思想的网络表示算法,如Deepwalk,node2vec以及LINE等。但是作者也明确指出了,上述这些算法虽然可以用于网络表示学习,但仅适合那些只包含一类顶点类型和边类型的同构网络(Homogeneous Networks),并不能很好地用于包含多种顶点类型和边类型的复杂关系网络。于是作者在基于meta-path的基础上,提出了能很好应对指定scheme结构的异构复杂关系网络的表示学习方法——metapath2vec和metapath2vec++。


metapath2vec的思路非常的简单,使用的是基于metapath的随机游走策略(deepwalk的游走策略的升级版,没有引入node2vec中的p,q参数),最终底层还是gensim+word2vec来实现embedding。

所谓的metapath就是指:
V表示节点,V可以是不同类型的节点,R表示边,R可以是不同类型边。

metapath2vec需要我们人工事先定义游走的路径,例如

有四种类型的节点,分别是org(机构),author(作者),paper(论文),venue(领域),原文中人工定义了固定的游走路径:

  • APA 即 作者-paper-作者 的路径(意思就是两个作者合著了一篇paper)
  • APVPA 即 作者-paper-领域-paper-作者(意思就是两个作者写的两篇paper是同一个领域的)
  • OAPVPAO 即 机构-作者-paper-领域-paper-作者-机构(意思是两个机构,两个作者的两篇paper属于同一个领域)

人工设定了游走的路径之后,后续生成的序列就只能是这种固定的形式了,

比如当前节点为author,author会和org,paper以及其它author有边存在,此时根据上面的公式,假设我们定义的metapath为APA,则author的下一步不会游走到其邻接的org或其他邻接的author上,只会在邻接的paper上实施和deepwalk一样的游走策略, when 当前节点author游走到某个paper的节点上时,当前节点为paper,此时根据APA的metapath的设定,下一步我们只能游走到当前paper的邻接的其他author上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发呆的比目鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值