一、 背景
今天准备学习网络图networkx的基本操作。选择的用例为一百年以前美国一些社会科学家从报纸上搜集的“知名女士参加社会活动的记录”,表结构简化如下:
通过网络图能否找出社交中的明星呢?这里说的明星是指:参加社交活动较多且认识其他知名女士较多的Lady。
二、 思路
按照以上定义,我们首先探索数据,先找出参加活动较多的女士,结果如下,看起来W01、W03参加活动最多,她们是不是就是我们要找的“明星”呢?
我们还需要找一下,这些人中,谁认识的人较多。这个目标怎么实现呢?老师给我们一个思路:假设参加同一个活动的Lady能相互认识,我们整理一个“女士见面次数表”。这样以来,我们就可以通过活动将这些女士联系起来,并形成一个网络图,形如:
图一
怎么看这样的图,难道在中心位置的就是圈子最大的人吗?为理清这一点,老师提出让我们把见面(同时