聚类系数
结点的度或者中心性在衡量结点重要性区分结点时起到很重要的作用但是对于图中结点度近似或者中心性近似的结点便很难区分它们。因此很有必要从其他角度挖掘图的特征。
聚类系数用于衡量邻接结点之间的连接程度(有的解释是衡量一个结点的局部邻域中闭合三角形的比例)。聚类系数分为全局的聚类系数和局部的聚类系数(还有其他变体如平均聚类系数等)。
全局聚类系数是对于全图而言的,是计算一个图中所有封闭的三点组的数量除以所有联通的三点组的数量。分子要求三点封闭,分母要求三点联通即可。
局部聚类系数是对于结点而言的,计算的是一个结点的所有邻接结点之间的边的数量除以邻接结点与当前结点的并集中所有结点彼此两两连接的边数。计算公式如下
在一些工作中计算聚类系数会提到聚类系数是衡量一个结点的局部邻域中闭合三角形的比例。也就是上面这个公式中分子是计算当前结点和其邻居结点构成三角形的数量(等价于邻接结点之间的边的数量)
Motifs & Graphlets
除了计数三角形之外还可以计算更加复杂的结构,常见的类型有计数Motif或者Graphlets。motifs和graphlets都是具有特定结构的子图,包含特定的信息。
subgraph子图是原图的一个子结构,其中结点和边都是原图中结点集和边集的一个子集
ego net 即自我中心网络是图中的一个子图,它由当前结点为中心和对应的邻接结点(可以是多跳邻居)组成,边是原图内对应结点之间的边。
Motifs模体,主题网络ÿ