将社交网络看成图
社交网络的基本概念:
- 社区(community):是指具有非同寻常的强连通性的节点子集,其中节点可以是构成网络的人或者其他实体。
- 局部性(locality):是指社交网络的节点和边趋向于聚为社区的这种性质。
社交网络的基本特点:
- 一大堆实体参与了网络的构成;
- 网络实体间至少存在一种关系,且关系要么存在要么不存在,关系也可以表示为度数,其中度数可为离散值和实数值;
- 对于社交网络有一个非随机性或局部性假设,其直观意义是关系倾向于聚团,即如果A与B和C都关联,那么B和C相互关联的概率会高于平均值。
社交图(social graph):将社交网络看成图,图的节点为实体,如果节点间存在刻画该网络的关系,则节点间有一条边。如果关系存在强弱之分,则每条边上还标识出关系的强弱程度。社交图可为无向图(eg:朋友图),也可为有向图(eg:粉丝关注图)。
K部图(k-partite graph):多类型节点构成的社交图。
社交网络图的聚类
对社交网络应用层次聚类:
- 将两个有边连接的节点聚成一类;
- 不在同一簇内节点间的边被随机(每条边代表的距离一样)选出,来合并这两个节点所属的簇;
- 重复第二步。
注:采用纯聚类算法永远不可能识别出重叠社区。