基于预测分析表法的语法分析程序_[20ECAI] 基于共同邻居子图分析的链接预测

本文提出了一种名为PLACN的新框架,用于链接预测,专注于分析目标链路上节点的共同邻居并利用深度学习方法。PLACN通过分析共同邻居的子图,结合卷积神经网络来提高预测精度,解决了现有方法在某些社交网络中精确度低的问题。实验结果显示,PLACN在多个真实网络上取得了96%以上的AUC,优于传统启发式方法和最新方法。
摘要由CSDN通过智能技术生成

Link Prediction by Analyzing Common Neighbors Based Subgraphs using Convolutional Neural Network

摘要

社交网络中的链接预测(Link prediction, LP)是对一个链接在未来是否有可能形成进行推断。社交网络(SN)是普遍存在的,并且有不同的类型,如人类互动和蛋白质相互作用网络。LP采用了包括共同邻居和资源分配在内的启发式方法来寻找未来链路的形成。这些启发式方法对不同类型的社交网络很敏感。某些类型的启发式对某些SN类型更有效,但对其他类型则不然。为特定类型的社交网络选择合适的启发式方法通常需要不断试错。最近的一些开创性的方法,WLMN和SEAL,表明这种选择过程可以对不同类型的SN进行自动化。虽然这些方法很有前途,但在某些类型的SN中,它们仍然存在精确度低的问题。本文的目标是通过引入一个名为PLACN的新框架来解决这一弱点,该框架包含了对目标链路上节点的共同邻居的分析,并通过深度学习方法对启发式特征进行组合。PLACN是由一种基于共同邻域的目标链接子图提取方法驱动的。另一个新颖之处是基于平均跳数和平均权重标记子图的方法。此外,我们还介绍了一种计算子图中节点的近似数目的方法。我们的模型将链接预测转化为图分类问题,并使用了一个卷积神经网络。我们在七个真实网络上测试了我们的模型,并与传统LP方法以及两种最新的基于子图的方法进行了比较。我们的结果优于其它LP方法,在基准SNs上的AUC达到96%以上。

1. 引言

链接预测(LP)在实际应用中具有众多实用价值,如电子商务和朋友推荐,以及在网络中发现未来的合作者。LP问题的目的是预测未来预计会发生或不会发生的链接。LP已经被探讨了二十余年,Jon Kleinberg和David LibenNowell的工作在[23]这个话题上有很大的影响,近年来引起了很大的关注。传统的方法包括一些启发式方法,如共同邻居(CN) [28],Adamic Adar (AA)[2],和资源分配(RA)[41]。其他方法包括监督学习方法,如SVM、bagging和Naive Bayes[5]。虽然已经提出了许多复杂的LP方法,但我们已经确定,对于某些类型的网络,存在简单的启发式方法,或这些启发式的组合,可以产生更准确的结果。对于任何给定的启发式,它不会在每一种不同类型的网络中以相同的精度执行。原因是这些方法的工作基于从网络拓扑中提取的模式,而这种模式可能因SN而异。这是启发式方法的一个重大缺点。为SN类型选择合适的启发式方法通常是一个不断试错的过程。weisfeler-lehman Neural Machine (WLNM)方法[39]提出了一种基于邻域内提取的子图自动寻找合适方法的求解方法。WLNM法是一种高精度的链路预测方法。

WLNM使用高阶启发式,如Katz指标[17]和Pagerank[23],以达到显著的准确性。但是,这需要将封闭子图扩展到整个网络的大量跳数,并且需要额外的计算时间和内存。为了克服这个问题,SEAL(从子图、嵌入、以及属性中学习链接预测方法)提出了一种利用图神经网络(GNN)[40]从局部封闭子图中学习一般图结构特征的方法。SEAL推导了gamma-衰减理论,以证明少量的跳数就足以提取高阶启发式,并相比WLNM达到更好的精度。然而,我们发现SEAL也有很多缺点。

我们的理论和实证结果激励我们建立一个新的链接预测框架,修正了SEAL的各种缺陷。首先,SEAL考虑了网络G = (V,E)中的一对节点(i,j)的h跳封闭子图,即节点i和节点j的最大h跳的邻居节点,其中可能包括也可能不包括预测节点i和j之间目标链路的必要节点。在我们提出的模型中,即下面描述的PLACN,我们根据节点i和j的不同顺序的共同邻居构建子图,这些节点属于目标链路。这些子图包含大量的必要节点,因为共同邻居由节点i和j共享。然后,SEAL用各种启发式特征和封闭子图a的邻接矩阵对i和j的向量X进行评估,以提供给GNN。SEAL只考虑了目标链路端点节点i和节点j的各种特征。它们忽略了子图中所有其他节点的启发式特征。考虑到整个子图的启发式特征,对在任意两个节点之间引入新链接有很大的影响。作为我们的贡献,我们考虑整个子图的启发式特征,以纳入子图中每个节点的影响。

此外,标记每个子图是处理图节点排序的必要任务,以保持所有子图的一致性。当有共同邻居在子图中时,SEAL不能很好地处理子图标记。我们将在子图标记部分对此进行进一步讨论。在PLACN中,我们引入了一种新的标注方法,它基于同时考虑跳数以及链接的权重来克服标签不一致的问题。由于我们的框架特别重视目标节点共同邻居的启发式特性来预测链接,因此我们将我们的模型命名为PLACN(Predicting Links by Analyzing Common Neighbors)。

我们的工作总结如下:

  1. 提出了一种构造子图的新方法;
  2. 我们引入了一种新的理论来寻找一个子图中包含的节点数K;
  3. 提出了一种保持邻接矩阵序列一致的标记算法;
  4. 我们提取了整个子图节点的启发式特征,并基于卷积神经网络(ConvNet)建立了一个新的链路预测框架;
  5. 我们证明,PLACN优于所有的启发式方法以及最先进的方法WLNM和SEAL。

<

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值