社区的直接发现
通过寻找有很多连边的节点子集直接发现社区的技术。
相关概念
- 团(clique):任意两个节点之间都存在边的节点子集。
- 二部图(bipartite graph):是由左右两个节点集合组成的图,每条边连接的都是左集合的一个节点和右集合中的一个节点。例子如下:
- 完全二部图(complete bipartite graph):二部图的两部分任意一对节点之间都有边。团是一般图的子图,完全二部图是一般二部图的子图,有时也称二部团。
- 刚刚
利用完全二部图发现社区
随机将节点分到两个相等的组中,如果存在某个社区,可以期望该社区的一半节点属于上述的组中,而一半的边存在于两个组之间。因此可以:
- 识别社区中较大的完全二部图(可以看成频繁项集的查找问题);
- 以子图为核心,对于两个组中的任意节点,如果和已经属于社区的节点间存在多条边,那就可以将它加入社区。
图划分
利用矩阵理论中的谱方法来建立图划分问题,使得不同分支之间的边或者称为“割(cut)”的数目最少。
图划分的好坏标准
- 最小割:使得连接两个集合的边(或割)数最少;
- 最优割:对“割”的选择有所限制,使得划分的两个集合的大小大致相等。
注意:最小割不一定是最优割。
归一化割
衡量割本身的大小和割导致的不同聚合大小的差异。
假定将途中节点划分成两个不相交的集合 S 和
C