论文笔记02
Link Prediction by Multiple Motifs in Directed Networks
有向网络中的多子图连接预测
1.基于单个子图朴素贝叶斯模型的链路预测
思想:考虑单个子图的数量和不同节点的不同贡献
计算节点x,y之间有边,无边的先验概率:
节点w有两种条件概率。 当节点x和y连接时或者断开时,节点w参与组合特定预测器的概率:
P(w)表示节点w和一对节点能够构成一定预测器的概率。 O(x,y)是一组节点,它可以与节点对(x,y)一起构成一个预测器。 将集合O(x,y)中的节点作为特征变量,并假设这些特征变量是相互独立的。可以计算节点x和y相互连接或断开的后验概率:
计算x,y链接与否的概率比值:
一对节点x和y之间连接或断开的概率,它们可以将预测器与节点w相结合:
节点w的角色函数如下(为防止分母为0,加1):
简化公式12:
上述模型称为MotifNaiveBayes(SMNB)模型。显然,给定一个网络,可以确定s的值。 取方程14的对数,表示节点x和y之间的特征评分,我们可以基于Eq15判断连接可能性。第一部分是包含预测链路的子图的数量,第二部分代表所有节点(或边缘)的角色函数的总贡献 。
2.基于两个子图朴素贝叶斯模型的链路预测
在两个基序/子图的结构中,对于一对节点x和y,O1(x,y)表示与第一种类型的预测器结合的节点集,O2(x,y)表示与第二类预测器结合的节点集。可以计算节点x和y连接或断开的后验概率:
节点x,y间链接与否的概率的比值:
节点w构成第一子图的封闭与非封闭预测器的概率:
计算从第一个预测器得到的节点w的角色函数Rw和从第二个预测器得到的节点v的角色函数Rv:
对于两个主题朴素贝叶斯模型,比值的取对数指节点x和y之间的特征分数。它由三部分组成,第一部分是指两个子图的数目之和,第二部分是第一子图的角色函数,第三部分表示第二个子图的角色函数。
两种方法性能比较发现,直接叠加多种子图不能保障性能的提高。
3. 使用机器学习框架的多个主题的链接预测
我们使用图中所有单子图朴素贝叶斯模型的特征分数作为多维特征,然后使用XGBoost分类器来集成多个子图的特征,并获得更高的预测性能。通过计算最大信息系数(MIC),得到了所有预测子图之间的相关性。分析所有子图之间的相关性,为基于多个子图的链路预测提供了一种子图特征选择的方式,减少了随机选中多个子图引起的性能的不稳定性。
4总结
主要运用了朴素贝叶斯的思想,然后结合了三节点和四节点的子图,提出单子图贝叶斯模型,两子图贝叶斯模型,多子图贝叶斯模型。用于有向网中预测节点间边的存在性。
思考:02就像是01的拓展
链接:https://www.sci-hub.pl/10.1109/access.2019.2961399