论文笔记——HDD算法：异构网络中信息扩散的深度学习方法

最新推荐文章于 2024-07-07 12:00:25 发布

翻译最新推荐文章于 2024-07-07 12:00:25 发布

· 817 阅读

1 ·

版权

原文链接：https://doi.org/10.1016/j.knosys.2019.105153

文章标签：

#算法 #深度学习

影响力最大化算法研究专栏收录该内容

16 篇文章

订阅专栏

HDD算法

发表在knowledge-Based Systems上的一篇文章。有许多现实世界的复杂系统与多类型相互作用的实体，可以被视为异构网络，包括人类连接和生物进化。这类网络的主要问题之一是预测信息的扩散，如未来社会事件的发展和演变的形状、增长和规模。信息扩散是网络上被广泛研究的动力学处理方法之一。新闻、创新和病毒等信息从一组种子节点开始，并在整个网络中传播。信息扩散已经在广泛的领域被研究，包括医疗保健、复杂网络和社交网络。网络系统上最重要的任务之一是理解、建模和预测网络主体中的快速事件和演变。该作者关注异构网络，并通过考虑不同的元路径为输入添加权重，提出了一种新的元路径表示学习方法HDD（Heterogeneous Deep Diffusion）。

算法的总体框架：

在这里插入图片描述

1 背景知识

1.1 元路径以及topic diffusion的目标

在这里插入图片描述
给出图 $T_{G}={A, G}$ ，元路径 $P$ 定义如下。A和R代表了节点和边的类型，元路径一般表示为 $A_{1}R_{1}A_{2}R_{2}...A_{l+1}$ 。如下图所示，两个作者直接的一条边代表他们之间有一篇论文，多条边则是多篇共同论文。所以，APA 则代表了两个作者 A 之间的论文 P 的元路径。同理，AVA 则是两个作者 A 共同在会议 V 上发表了论文。
而topic diffusion则旨在解决当一个节点 $i$ 在 t 时刻写了论文时，在 $t + 1$ 时刻究竟是哪个作者又会写一篇论文的问题。

1.2 级联 Cascade

假设有N个主题， $N=n_{i}(1<i<N)$ 。对于每个主题 $N_{i}$ ，联级 $C_{i}=(u_{i}, v_{i}, t_{i})$ 来记录主题 $n_{i}$ 的扩散过程：作者 $v_{i}$ 在时间 ${t_{i}}$ 引用 $u_{i}$ 。
在这里插入图片描述
如上图，可以表示为 $(p a p e r 1, t 1 = 0), (p a p e r 1, p a p e r 2, t 2), (p a p e r 1, p a p e r 3, t 3), (p a p e r 1, p a p e r 4, t 4), (p a p e r 1, p a p e r 5, t 5)$ 。

1.3 LSTM

关于LSTM的讲解，大佬们已经解释的非常清楚了，这里只用截图。
在这里插入图片描述

2 提出的方法

2.1 作者（节点）embedding

每一个节点都要用一个向量来表示。这里 $\in R^{N}，N$ 是作者的数量，所有的作者都共享一个嵌入张量embedding tensor $\in R^{N*N*T_{s}}，T_{s}$ 是时间戳的数量。
如果t1中的两个节点将共同撰写关于特定主题的论文，则最后一列用于输出为1（活动节点），否则被视为0（非活动节点）。