基于共现发现人物关系的python实现+gephi人物关系网+tableau词云

今天做的是小说人物关系图,小说是我最喜欢的一本,我看了好多遍,闲听落花的《盛华》。

共现:将每一段中的人物角色抽取出来,然后以段落为单位,统计两个角色同时出现的出现次数,并把结果存在一个二维矩阵之中。这个矩阵也可以作为关系图的矩阵,矩阵中的元素(统计的出现次数)就是边的权值。

#这个是标准语法,可以得到人物和人物出现的次数,《盛华》人物太多,且jieba.load_userdict在我这里没有反应,我改了一下代码。

import os, sys
import jieba, codecs, math
import jieba.posseg as pseg

names = {}            # 姓名字典
relationships = {}    # 关系字典
lineNames = []        # 每段内人物关系

jieba.load_userdict("dict.txt")        # 加载字典
with codecs.open("busan.txt", "r", "utf8") as f:
    for line in f.readlines():
        poss = pseg.cut(line)        # 分词并返回该词词性
        lineNames.append([])        # 为新读入的一段添加人物名称列表
        for w in poss:
            if w.flag != "nr" or len(w.word) < 2:
                continue            # 当分词长度小于2或该词词性不为nr时认为该词不为人名
            lineNames[-1].append(w.word)        # 为当前段的环境增加一个人物
            if names.get(w.word) is None:
                names[w.word] = 0
                relationships[w.word] = {}
            names[w.word] += 1                    # 该人物出现次数加 1


#看一下效果
for name, times in names.items():
    print(name, times)
import os, sys
import jieba, codecs, math
import jieba.posseg as pseg

names = {}            # 姓名字典
relationships = {}    # 关系字典
lineNames = []        # 每段内人物关系

words = [line.strip() for line in open("C:/Users/Dell/Desktop/郑佳重要/python/namedict.txt",encoding='UTF-8').readlines()]
#我把主要出场人物保存在words中,只统计在words中出现的人物之间的关系

with codecs.open("C:/Users/Dell/Desktop/郑佳重要/python/盛华.txt", "r") as f:
    for line in f.readlines():
        poss = pseg.cut(line)        # 分词并返回该词词性
        lineNames.append([])        # 为新读入的一段添加人物名称列表
        for w in poss:
            if w.word in words:
                           
                lineNames[-1].append(w.word)    
                if names.get(w.word) is None:
                    names[w.word] = 0
                    relationships[w.word] = {}
                names[w.word] += 1  

#此时得到的人物和频率会更整齐

#统计每个人出现的次数,和他们的共现次数
for line in lineNames:                    # 对于每一段
    for name1 in line:                    
        for name2 in line:                # 每段中的任意两个人
            if name1 == name2:
                continue
            if relationships[name1].get(name2) is None:        # 若两人尚未同时出现则新建项
                relationships[name1][name2]= 1
            else:
                relationships[name1][name2] = relationships[name1][name2]+ 1        # 两人共同出现次数加 1
                
with codecs.open("C:/Users/Dell/Desktop/郑佳重要/python/busan_node.csv", "w", "gbk") as f:
    f.write("Id Label Weight\r\n")
    for name, times in names.items():
        f.write(name + " " + name + " " + str(times) + "\r\n")

with codecs.open("C:/Users/Dell/Desktop/郑佳重要/python/busan_edge.csv", "w", "gbk") as f:
    f.write("Source Target Weight\r\n")
    for name, edges in relationships.items():
        for v, w in edges.items():
            if w > 3:
                f.write(name + " " + v + " " + str(w) + "\r\n")

此时会得到两个表,一个是单个人物在书中的出现次数,node表。另外一个是统计两个人物共现的次数edge表。

使用gephi做人物关系网图。《盛华》这本小说很长,两百多万字,且文章中名字并不十分统一,举例来说,李夏,阿夏,王妃都是一个人,所以统计并不精确。

gephi的这个页面真的好好看啊。

我最后做出来的关系图,说实话,真的丑,我下载的gephi预览模块不好用。

突然想起来我有tableau,顺便做个词云吧!用的是前面得到的node表,里面是单个人物在书中的出现次数。

1、打开node表

 2、打开工作表1

 把id列和Weight(频数)列放在下面的位置。

 

 

 

 

我有很多好看的字体。

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
抱歉,我并不具备绘制图形的能力,但我可以提供一些思路和工具。 要画人物关系图,首先需要有人物关系数据。可以从小说、电视剧等作品搜集得到。这里以《人民的名义》为例,假设已经有了以下人物关系数据: ``` 赵德汉,李达康 赵德汉,李书记 李达康,李书记 李达康,白岩松 李书记,吕同芳 吕同芳,侯亮平 侯亮平,高育良 高育良,陆亦可 陆亦可,祁同伟 祁同伟,高小琴 高小琴,孙连城 孙连城,赵立春 ``` 接下来可以使用 Python 处理这些数据,生成 Gephi 软件可以识别的格式。 ```python import networkx as nx # 读取人物关系数据 data = [] with open('data.txt', 'r') as f: for line in f.readlines(): nodes = line.strip().split(',') data.append((nodes[0], nodes[1])) # 创建有向图 G = nx.DiGraph() # 添加人物节点和边 for d in data: G.add_edge(d[0], d[1]) # 输出为 Gephi 格式 nx.write_gexf(G, 'out.gexf') ``` 上述代码使用了 `networkx` 库,可以方便地创建有向图,并将结果输出为 Gephi 格式。要使用 Gephi 软件来绘制图形,可以按照以下步骤: 1. 下载并安装 Gephi 软件; 2. 打开 Gephi 软件,选择“Open a File”菜单,打开上述 Python 代码生成的 `out.gexf` 文件; 3. 在左侧的“Overview”窗格,可以看到节点和边的信息。可以使用“Layout”菜单来对节点进行布局,如使用“Force Atlas”布局; 4. 在右侧的“Preview”窗格预览图形,并按需调整颜色、大小等参数; 5. 将结果保存为图片或 PDF 等格式。 希望这些思路和工具能够帮助你绘制出理想的人物关系图。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值