手把手教你上手Gephi制作基于共现矩阵的论文作者关系图谱

引言:Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
——摘自百度百科

温馨提示:近期本人访问GitHub出现间歇性访问失败情况,因此如果GitHub链接访问不了,不是链接给错了或者失效,而是GitHub本身访问问题,在不同时间段多试几次即可

提前预览下我们要做出来关系图谱

共现矩阵的构建算法该图片的.gexf文件可在我的Github上看到,如果你觉得对你有帮助,欢迎star和fork我:)。
在这里插入图片描述
【解释】:

  1. 图中结点越表示该作者发表的论文越多,对该领域的贡献越大
  2. 图中边越则两两作者的合作关系越多,合作关系越密切
  3. 本例使用的是力引导布局(基于库伦斥力胡克弹力算法),由于节点数3000+,不适合使用环形布局。

有木有很心动的感觉?!!那就赶快和我一起上车吧✿✿ヽ(°▽°)ノ✿

一、数据准备

①节点数据:

对于大规模节点和复杂的关系,无法通过手动一个一个节点的添加,往往通过程序处理好程序存储xlsx表格或csv文件中。
在这里插入图片描述
注意:表头中的IdLabel必填项,且表头项首字母必须大写,否则Gephi可能识别不了。

②边数据:

其中,SourceTargetType为必填项。Source表示源节点,Target表示目标节点。Type的两个选项UndirectedDirected分别表示无向图有向图
在这里插入图片描述
获得以上数据,需对原数据构造共现矩阵,并以三元组形式存储。如何《构建共现矩阵》请见此

二、在Gephi中导入数据

分别导入节点的电子表格,如下图所示(因为是作者间的合作关系,所以这里用无向图):
在这里插入图片描述
点击概览可看到如下初始网络关系图(图的右上角可看到节点和边的个数):

  • 3017个节点.
  • 6041个边.

在这里插入图片描述

三、设置节点的大小和颜色

根据节点的权值来设置每个节点的尺寸,本例中结点的权值作者发表论文的频数。并设置最小和最大尺寸,点击应用即可看到如下图变化。
在这里插入图片描述
根据节点的权值来设置每个节点的颜色
在这里插入图片描述
或者可以像我这样自定义设置,将所有节点按照点的权值大致分成三类,点击调色板可选择自己需要的类型,选好后可以更改每个项的颜色值。(注:占比越大的颜色项目表示权值越小的点,因为本例中权值小的点占大多数)
在这里插入图片描述

四、设置布局

常用布局有力引导布局(Force Atlas)和环形布局(Fruchterman Reingold)。

在这里插入图片描述
这里采用力引导布局(ForceAtlas 2),,需要勾选防止重叠项以保证每个节点不重叠:
在这里插入图片描述
点击运行后等待算法迭代到合适时间(20s左右)就点击停止,我的结果如下:
在这里插入图片描述

五、节点标签设置

接下来就该设置我们图片节点的标签啦,点击左下角T按钮设置节点Label显示,然后设置Label按节点大小显示(即Label字体大小和节点权值成正比),最后调整全局Label大小到美观即可。若是有向图,则可以通过点击旁边灰色的T按钮以显示边的Label。

注意右边统计栏中的模块化平均聚类系数需保证为运行状态(Gephi默认运行)。
最后设置结果图如下:是不是比初始打开时黑漆漆的一坨黑点要美观很多?
在这里插入图片描述

六、边的颜色设置

对于上图我们也可以把边的颜色设置为自己喜欢的,比如此处我按照边的权值将边设置为橘色。且边权值越大,边线条越粗
在这里插入图片描述

七、预览设置

点击预览选项,可以设置标签样式,这里我以自己的爱好设置为文本轮廓样式(标签外边缘有白色轮廓)。同时勾选显示标签选项,点击下方刷新按钮就可以看到右边的预览图形。
在这里插入图片描述
字体不合适的可以再次设置一下标签字体,此处我设置字体大小为3
在这里插入图片描述
同时配置边的颜色项原始的(original),这样我们就可以在右图看到我们之前在概览设置的图形啦。
在这里插入图片描述
如果点击刷新按钮不出现图,则可能你的预览选项卡没打开,在窗口菜单中重新打开即可。
在这里插入图片描述

八、保存格式

点击左下角可保存为png等其他支持格式。
在这里插入图片描述
若网络过于庞大,保存为图片模糊失真,则可以在文件→输出→图文件中保存为.gexf格式。

在这里插入图片描述
.gexf格式文件实质是以XML存储图的结点信息,包括但不限于结点的Id、Label、权值以及在图形中的坐标,可用Gephi以及其他支持该文件的软件打开,不会失真。具体关于该格式的详细信息请见底部参考文献[5]。
在这里插入图片描述
最后成形的关系图谱如开篇所示,完结撒花✿✿ヽ(°▽°)ノ✿。

【参考文献】:
[1] 五分钟Gephi入门视频:数据可视化.
[2] Eastmount.[关系图谱] 一.Gephi通过共线矩阵构建知网作者关系图谱.
[3] Gephi学习笔记-画出图形基本流程.
[4] Gephi快速入门指南.pdf
[5] GEXF Working Group.GEXF文件扩展名概述.

  • 25
    点赞
  • 164
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 11
    评论
Gephi是一个开源的网络分析和可视化软件,可以用来研究和展示各种类型的网络数据。在Gephi中,关键词共现矩阵是一种用于分析关键词之间共同出现的模式和关系的方法。 关键词共现矩阵是一个由行和列组成的矩阵,其中每个行和列代表一个关键词。矩阵中的每个单元格包含了两个关键词之间的共现次数或者共现频率。通过分析这个矩阵,我们可以了解到哪些关键词经常一起出现,以及它们之间的关系密切程度。 使用Gephi进行关键词共现矩阵分析的步骤大致如下: 首先,我们需要准备一个数据集。数据集可以是一份文本文件,其中包含一系列的文档或文章。在每篇文章中,我们可以提取出关键词或者短语来作为分析的对象。 接下来,我们需要使用一个自然语言处理(NLP)工具来对文本进行处理,去除一些无用的单词,例如停用词、标点符号等。然后,我们可以使用合适的算法,如TF-IDF(词频-逆文档频率)算法来计算每个关键词的重要性。 然后,我们将建立一个关键词共现矩阵。在矩阵中,每个行和列代表一个关键词,而矩阵中的每个单元格则表示两个关键词之间的共现次数或者共现频率。 最后,我们可以使用Gephi软件进行可视化和分析。通过将关键词共现矩阵加载到Gephi中,我们可以使用各种布局算法和图形显示方式来展示关键词之间的关系。我们可以根据共现次数或者共现频率来调整节点和边的大小和颜色,以显示出关键词之间的不同关系。 总而言之,Gephi关键词共现矩阵分析是一种通过网络分析和可视化软件来研究和展示关键词之间共同出现模式和关系的方法。通过分析关键词之间的共现矩阵,我们可以更深入地了解关键词之间的关系,从而帮助我们进行更准确的文本分析和信息提取。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SL_World

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值