图论中的聚类系数(Clustering coefficient)简单介绍

November丶Chopin

已于 2022-10-12 17:57:44 修改

阅读量2.9w

点赞数 20

分类专栏：专栏03-图神经网络文章标签：图论图神经网络

于 2022-10-12 17:55:29 首次发布

本文链接：https://blog.csdn.net/u012762410/article/details/127276205

版权

13 篇文章

订阅专栏

前言

在GraphSage论文的理论分析部分，涉及到一个概念叫做“Clustering coefficient”，直译过来就是聚类系数，解释为“节点的一跳邻域内封闭的三角形的比例”，本文对其做一个简单的介绍。本文参考了 Wiki百科-Clustering coefficient。

在图论中，聚类系数是图中节点倾向于聚类在一起的程度的度量。相关论文表明¹ ²，在大多数现实世界的网络中，尤其是社交网络中，节点倾向于创建紧密结合的群体，其特征是联系密度相对较高；这种可能性往往大于两个节点之间随机建立联系的平均概率。

聚类系数主要有两种度量方式：局部和全局。

一个节点的局部聚类系数量化了它的邻居节点离成为团(clique，即每两个不同的顶点都是相邻的。参见wiki百科-clique)有多近，简单来说就是，节点的一跳邻域内封闭的三角形的比例。

举个例子说明：
在这里插入图片描述

图1 无向图上的局部聚类系数计算示例

图中的灰色线表示节点A与邻居的连接，黑实线是邻居之间的连接，红色表示图1(2)和(3)相比于图1(1)去掉的连接。
节点 A 的局部聚类系数计算为：其邻居之间实际实现的连接与所有可能连接的数量的比例，或者为节点A的一跳邻居内封闭的三角形的比例。

邻居之间实际实现的连接与所有可能连接的数量的比例： 如图1所示，A的邻居为(P1,P2,P3)，P1,P2,P3之间最多可以有3个连接，图1中的(1)(2)(3)的P1,P2,P3之间分别有3个,1个和0个连接，所以聚类系数 $C$ 分别为 1,1/3和0。
邻居内封闭的三角形的比例： 如图1所示，A的邻居为(P1,P2,P3)与A最多形成3个三角形： $\Delta AP_1P_2$ , $\Delta AP_2P_3$ , $\Delta P_1P_2P_3$ ，图1中的(1)(2)(3)符合条件的三角形分别有3个,1个和0个，所以聚类系数 $C$ 分别为 1,1/3和0。

全局聚类系数是封闭三元组（或3个三角形）在三元组（开放和封闭）总数上的数量。

这部分待更新…

P. W. Holland & S. Leinhardt (1971). “Transitivity in structural models of small groups”. Comparative Group Studies. 2 (2): 107–124. doi:10.1177/104649647100200201. S2CID 145544488 ↩︎
D. J. Watts & Steven Strogatz (June 1998). “Collective dynamics of ‘small-world’ networks”. Nature. 393 (6684): 440–442. Bibcode:1998Natur.393…440W ↩︎