前言
这次我们将分析整个红楼梦的社交网络。我们尝试用算法去寻找红楼梦中最重要的人物,最有权势的人物,以及一些关系亲密的小团体。看看都有哪些有趣的发现吧。
社交网络
据统计,红楼梦中出场人数共有四百四十八人。这一次,我们分析大约三百六十人。为了增加统计的准确率,我们将人物的一些不同表达拎出来,放到一个人物中。比如林黛玉,林妹妹,我们都算黛玉;贾宝玉和宝玉合并;王熙凤,凤姐以及凤辣子都算作凤姐。
我们采用共现的技术来建立人物关系,即一段文字中两个人物出现,则给这两个人物的联系记上一笔,若以后在其他语句中再出现,再加上一笔,以此类推,直到找到所有人物关系节点。
最终我们获得了红楼梦三百多个人物的社交网络图:
这里截取的只是一部分,节点中心是贾母,人物之间的联系用灰色的线连起来,加粗灰线连接的节点是和贾母有关系的人。除了主角团,我们可以发现一些和贾母有关联的不常见人物:
(1)下方的贾氏一族,包括宝玉的玩伴,秦可卿的弟弟秦钟。
(2)贾母丈夫贾代善的替身。张道士小时出家,就是为贾家的老祖宗史太君的丈夫当替身,替他出家、消灾。
网络分析
虽然我们获得了全人物的社交网络,但是网络太过错综复杂,不是很好从里面直接提取信息。我们利用Python中的Netowrkx工具,进一步分析。
1.重要人物网络
我们找到