链路预测算法的评价指标

堇禤

已于 2022-04-05 20:00:25 修改

阅读量3.3k

点赞数 3

分类专栏：链路预测文章标签：数据挖掘机器学习深度学习

于 2022-03-28 09:48:20 首次发布

本文链接：https://blog.csdn.net/CRW__DREAM/article/details/123786125

版权

链路预测专栏收录该内容

6 篇文章

订阅专栏

衡量链路预测算法的精确度的指标有三种：AUC、Precision、Ranking Score。

定义（G, V, E）为一个无向网络，其中V为节点集合，E为边的集合。网络中总的节点数为N，边数为M，则该网络中不考虑相连关系的话共有N(N-1)/2个节点对，即全集U。
将网络中已知的连边E分为训练集E^T和测试集E^P两部分，E^P是在E的范围内随机选取的连边，并将选取后的E^p从E中删掉变成E^T。此时E^T∪E^P=E，E^T∩E^P= $\emptyset$ 。网络中还有E中不包含的连边的集合（两个节点之间没有边），我们将此集合定义为不存在的边。

一、AUC

一个算法经过训练得到网络中每一对节点之间的相似值，AUC指标就是比较测试集中的边的相似值和不存在的边的相似值的大小。
在这里插入图片描述

若Sim_测试 > Sim_不存在，则数值的分子加1（此时证明预测效果良好）；

若 Sim_测试 = Sim_不存在，则数值的分子加0.5（此时相当于随机选择）；

若Sim_测试 < Sim_不存在，则数值的分子加0。
（Sim表示相似值）
数值的分母是测试集中的边的相似值与不存在的边的相似值比较的次数。比如测试集中2条边，不存在中3条边，那么比较次数就是6次。
AUC指标即为数值分子与数值分母的比值，AUC大于0.5的程度衡量了算法在多大程度上优于随机选择的算法。

注：

链路预测只能预测边，不能预测节点。
更多AUC的内容，请参考：https://blog.csdn.net/Queen0911/article/details/109693384

二、Precision

Precision只考虑前L位的边是否预测准确。链路预测算法经过训练后会得到节点对之间的相似值，去除训练集E^T中的边，仅将测试集E^P和不存在的边集合中的边的相似值进行排序，排序后取前L个。假设L个中有N个属于测试集，那么Precision值为N/L。
L的值如何设定，这是一个好问题！阅读其他论文，有的研究者选择了L=50,100,150,200,250都计算一遍，然后画了个折线图，不论L等于多少，你提出的算法的精确度比其它算法好就行。