文献阅读（38）ICLR2021-Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks

学徒刘猛

已于 2022-10-28 12:14:00 修改

阅读量2.2k

点赞数 3

分类专栏：文献阅读文章标签：神经网络机器学习深度学习人工智能

于 2021-03-07 16:41:40 首次发布

本文链接：https://blog.csdn.net/CSDNTianJi/article/details/114488437

版权

文献阅读专栏收录该内容

87 篇文章 32 订阅

订阅专栏

本文是对《Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks》一文的浅显翻译与理解，如有侵权即刻删除。

朋友们，我们在github创建了一个图学习笔记库，总结了相关文章的论文、代码和我个人的中文笔记，能够帮助大家更加便捷地找到对应论文，欢迎star~

Chinese-Reading-Notes-of-Graph-Learning

更多相关文章，请移步：文献阅读总结：网络表示学习/图学习

Title

《Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks》

——ICLR2021

Author: Yanbang Wang

总结

文章认为，以往的网络表示学习方法通常依赖于节点身份信息或丰富的边缘属性，无法提取网络变化的规律。因而，提出了因果关系匿名游走的CAW-N算法，通过隐藏节点身份捕捉网络变化规律。相比以往的匿名游走不共享节点标识，文章用节点的命中次数来代替节点身份，能够对多次游走进行区分；此外，在进行随机游走时，文章提出了新的边采样策略来采样随机游走，并最终提出编码策略对游走进行编码。算法的伪代码如下：

在这里插入图片描述

1 网络定义

时序网络由带有时间标签的节点交互（即时序边）组成，对于一次游走，形式定义如下：

在这里插入图片描述

2 匿名游走

匿名游走指的是，在一次随机游走中，隐藏节点的真实身份，仅以序号id作为标识，来研究游走中的变化规律。
在这里插入图片描述
文章认为，匿名游走是不共享节点标识空间的，即每次游走中节点的id都会从头开始计数，这样多次游走中的节点id会产生重复，就会遇到如下情况：

在这种情况下，单纯的匿名游走是无法识别出a和a’的区别的，而文章提出的因果关系匿名游走则具备这个能力。

3 因果关系匿名游走(causal anonymous walk)

3.1 因果关系抽取

文章通过确定一个时间，反向从过去的交互中进行采样生成游走路径，并引入了一个非负超参数a来控制选择边的概率，这个概率与事件有关，即exp(a(t-t_p))。其中，t是当前时间，t_p是先前时间，a越大越意味着发生时间较近的交互越容易被选中，而当a为0时，即随机选择。此外，文章还在附录中给出了更加灵活的采样策略，避免了每次游走都要对每条边进行概率的计算。

文章提出的采样策略分为两部分：在线概率计算和迭代采样。

其中，在线概率计算是对一条边(u,v)计算一对概率，即在众多边中选择该边的权重：
在这里插入图片描述
其伪代码如下：

在这里插入图片描述

而迭代采样则是对算法1第五步的实现，文章证明了这种采样策略是与上文提到的exp(a(t-t_p))计算处的概率成正比的，其伪代码和证明过程如下：

在这里插入图片描述

从而，给出一条边(u,v,t)，就可以通过算法1来采集M条m步的分别开始于u和v的随机游走，并将它们记录到集合S_u和S_v中。

3.2 基于集合的匿名化

得到上述的两个集合，算法可以对任意节点w进行匿名化标识，这些节点至少会在一次游走中出现，它们被定义为：

在这里插入图片描述

与匿名游走不同，因果关系的匿名游走可以捕捉不同游走路径间的关系，从而作为一个重要的枢纽反映出时序网络的动态变化规律。在此，文章进行了举例说明如下：

在这里插入图片描述

假设在节点交互过程中，存在着一条规律：一个节点只有在另一个节点与其交互至少两次的情况下才会与其他节点交互。那么捕捉了因果关系的匿名游走CAW就要比单纯的CAW更能够捕捉到这一规律。以上图为例，CAW比AW好的地方就在于，当节点两次交互同一节点，和两次交互不同节点，这两种情况都进行匿名化后，CAW能够捕捉到它们之间的差异，而AW不能。事实上，上述所举的规律不一定存在，只是进行举例论证。

具体而言，因果关系匿名游走在匿名化节点身份时，采取了命中次数的策略：

在这里插入图片描述