小白笔者最近一段时间在学习链路预测(Link Prediction),在查阅资料的时候,偶然间看到了吕琳媛和周涛合著的《链路预测》这本书,这是一本非常好的书,对经典的链路预测算法讲述的比较清楚,其中为了让读者理解链路预测的含义和计算方法,作者举了一个例子,如下图所示:
图1 示例网络
在书中,作者用CN指标、RA指标以及Jaccard指标计算节点的相似性。
三种指标的计算公式如下:
其中
表示相似性矩阵,
表示网络的邻接矩阵,
表示节点
的邻居节点的集合,
表示节点
的邻居节点的集合。
(1)CN指标:
CN指标是基于局部信息的结构相似性指标,其本质是两个节点的共同邻居越多,两个节点越相似,产生连边的可能性越大,上市实际上计算的是节点之间路径长度为2的数目,这一点比较容易理解,节点