文献阅读(38)ICLR2021-Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks

本文是对《Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks》一文的浅显翻译与理解,如有侵权即刻删除。

朋友们,我们在github创建了一个图学习笔记库,总结了相关文章的论文、代码和我个人的中文笔记,能够帮助大家更加便捷地找到对应论文,欢迎star~

Chinese-Reading-Notes-of-Graph-Learning

更多相关文章,请移步:文献阅读总结:网络表示学习/图学习

Title

《Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks》

——ICLR2021

Author: Yanbang Wang

总结

文章认为,以往的网络表示学习方法通常依赖于节点身份信息或丰富的边缘属性,无法提取网络变化的规律。因而,提出了因果关系匿名游走的CAW-N算法,通过隐藏节点身份捕捉网络变化规律。相比以往的匿名游走不共享节点标识,文章用节点的命中次数来代替节点身份,能够对多次游走进行区分;此外,在进行随机游走时,文章提出了新的边采样策略来采样随机游走,并最终提出编码策略对游走进行编码。算法的伪代码如下:

在这里插入图片描述

1 网络定义

时序网络由带有时间标签的节点交互(即时序边)组成,对于一次游走,形式定义如下:

在这里插入图片描述

2 匿名游走

匿名游走指的是,在一次随机游走中,隐藏节点的真实身份,仅以序号id作为标识,来研究游走中的变化规律。
在这里插入图片描述
文章认为,匿名游走是不共享节点标识空间的,即每次游走中节点的id都会从头开始计数,这样多次游走中的节点id会产生重复,就会遇到如下情况:
在这里插入图片描述

在这种情况下,单纯的匿名游走是无法识别出a和a’的区别的,而文章提出的因果关系匿名游走则具备这个能力。

3 因果关系匿名游走(causal anonymous walk)

3.1 因果关系抽取

文章通过确定一个时间,反向从过去的交互中进行采样生成游走路径,并引入了一个非负超参数a来控制选择边的概率,这个概率与事件有关,即exp(a(t-t_p))。其中,t是当前时间,t_p是先前时间,a越大越意味着发生时间较近的交互越容易被选中,而当a为0时,即随机选择。此外,文章还在附录中给出了更加灵活的采样策略,避免了每次游走都要对每条边进行概率的计算。

文章提出的采样策略分为两部分:在线概率计算和迭代采样。

其中,在线概率计算是对一条边(u,v)计算一对概率,即在众多边中选择该边的权重:
在这里插入图片描述
其伪代码如下:

在这里插入图片描述

而迭代采样则是对算法1第五步的实现,文章证明了这种采样策略是与上文提到的exp(a(t-t_p))计算处的概率成正比的,其伪代码和证明过程如下:

在这里插入图片描述
在这里插入图片描述

从而,给出一条边(u,v,t),就可以通过算法1来采集M条m步的分别开始于u和v的随机游走,并将它们记录到集合S_u和S_v中。

3.2 基于集合的匿名化

得到上述的两个集合,算法可以对任意节点w进行匿名化标识,这些节点至少会在一次游走中出现,它们被定义为:

在这里插入图片描述

与匿名游走不同,因果关系的匿名游走可以捕捉不同游走路径间的关系,从而作为一个重要的枢纽反映出时序网络的动态变化规律。在此,文章进行了举例说明如下:

在这里插入图片描述

假设在节点交互过程中,存在着一条规律:一个节点只有在另一个节点与其交互至少两次的情况下才会与其他节点交互。那么捕捉了因果关系的匿名游走CAW就要比单纯的CAW更能够捕捉到这一规律。以上图为例,CAW比AW好的地方就在于,当节点两次交互同一节点,和两次交互不同节点,这两种情况都进行匿名化后,CAW能够捕捉到它们之间的差异,而AW不能。事实上,上述所举的规律不一定存在,只是进行举例论证。

具体而言,因果关系匿名游走在匿名化节点身份时,采取了命中次数的策略:

在这里插入图片描述

可以理解为,S中存放的是M个m步基于节点w开始的随机游走。那么其中出现的节点,都可以用出现位置计数的方式来表示。针对单次游走而言,节点的id就可以替换为在S中游走各位置出现的次数编码。则式3存放的应当是两个字符串,字符串的每个位置都是一个计数。

在这种情况下,再回看上文中的图3,虽然a和a’两个节点的交互是相同的,但是基于它们展开的随机游走的位置计数是不同的,就能够有效区分两个相似的节点,从而共享了多次游走中的节点id。从而,随机游走具有了如下的形式,用命中次数标识节点id:

在这里插入图片描述
首先对节点u和v分别得到M个m步的随机游走集合Su和Sv。给出任一游走路径,其中包含的节点,都可以用该节点在两个集合各个位置上出现的次数来匿名化表示,如下所示:

在这里插入图片描述

此外,对于图3中提到的问题,文章还给出了定理说明:

在这里插入图片描述

即对两对游走集合而言,如果存在一个映射Π,能够将前者的每个位置节点id(即位置计数)都正好转变为后者对应位置的节点id,那对集合中的所有节点而言,至少存在一次游走使得这两个游走集合得到的位置计数相等。

4 嵌入编码

文章对每次匿名游走,都编码成向量的形式:

在这里插入图片描述

该编码分为两部分,一部分是基于游走过程中位置计数的编码,另一部分是对时间的编码,对于一些有附加信息的网络,同样可以将其编码为向量进行结合。
对前一部分,由于文章设定的游走路径一般为1-5,并不很长,因此使用基本的RNN结构就能够完成很好地编码效果:

在这里插入图片描述
对后一部分,文章使用随机傅里叶变换来实现:

在这里插入图片描述

在对单条游走编码完成后,最终要回到对游走集合的编码,文章给出了两种编码方式,基于平均化的和基于自注意力机制的:

在这里插入图片描述

在对集合编码完成后,就意味着是对一条在特定时间发生交互的节点对进行编码,这种生成的嵌入向量,就能够用于后续的链路预测过程中,文章使用了双层感知机来完成最终的预测。

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值