gephi生成网络关系图_用python分析小说人物关系(一)——理论篇

本文介绍了如何利用jieba分词提取人物名,通过gephi绘制社会语义网络图。首先,借助jieba对文本进行分词并统计人物出场次数,然后以段落为单位分析人物关系,生成gephi所需的csv格式数据。虽然统计方法存在不足,但绘制的网络图仍具有参考价值。最后,简述了gephi的安装与基本使用。
摘要由CSDN通过智能技术生成

7983fb02c0eeec6943622df4e45e489a.png

1、工具介绍

jieba

jieba分词,最好用的开源中文分词工具。他最主要的两个功能是分词和关键词的抽取。在这里,我们需要用他的分词功能来提取文本中的人名。

gephi

gephi是一个开源的复杂网络数据可视化软件,可用于探索数据分析、链路分析、社交网络分析、生物网络分析等。我们需要把数据处理成gephi可接受的csv格式,然后再进行绘制。感兴趣的可以查看使用教程

Gephi 入门使用_网络_飞羽的博客-CSDN博客​blog.csdn.net
1357b327e68bb1d1c97bcb2aaaed857f.png

2、背景

数据处理方式

在词云中,我们只能通过词的大小来了解该词对于文本集是否起关键作用,无法探究人物之间的关系;在关系网图中,不仅可以了解词的关键程度,还能发现人物之间的联系,更能说明问题。由此可见,绘制词云时,我们只需要提取两列数据,一列人名,一列为频率。而绘制网络图时,就需要两组数据。网络图,顾名思义,就是一张图。所有的图都是由节点和边构成的。节点数据也就是

抱歉,我并不具备绘制形的能力,但我可以提供一些思路和工具。 要画人物关系,首先需要有人物关系数据。可以从小说、电视剧等作品中搜集得到。这里以《人民的名义》为例,假设已经有了以下人物关系数据: ``` 赵德汉,李达康 赵德汉,李书记 李达康,李书记 李达康,白岩松 李书记,吕同芳 吕同芳,侯亮平 侯亮平,高育良 高育良,陆亦可 陆亦可,祁同伟 祁同伟,高小琴 高小琴,孙连城 孙连城,赵立春 ``` 接下来可以使用 Python 处理这些数据,生成 Gephi 软件可以识别的格式。 ```python import networkx as nx # 读取人物关系数据 data = [] with open('data.txt', 'r') as f: for line in f.readlines(): nodes = line.strip().split(',') data.append((nodes[0], nodes[1])) # 创建有向 G = nx.DiGraph() # 添加人物节点和边 for d in data: G.add_edge(d[0], d[1]) # 输出为 Gephi 格式 nx.write_gexf(G, 'out.gexf') ``` 上述代码使用了 `networkx` 库,可以方便地创建有向,并将结果输出为 Gephi 格式。要使用 Gephi 软件绘制形,可以按照以下步骤: 1. 下载并安装 Gephi 软件; 2. 打开 Gephi 软件,选择“Open a File”菜单,打开上述 Python 代码生成的 `out.gexf` 文件; 3. 在左侧的“Overview”窗格中,可以看到节点和边的信息。可以使用“Layout”菜单来对节点进行布局,如使用“Force Atlas”布局; 4. 在右侧的“Preview”窗格中预览形,并按需调整颜色、大小等参数; 5. 将结果保存为片或 PDF 等格式。 希望这些思路和工具能够帮助你绘制出理想的人物关系
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值