前言
本文讲解了使用gephi软件导入网络数据并进行可视化,Gephi是一款开源的网络可视化软件,可以帮助用户导入网络数据并进行可视化分析。
一、准备CSV格式的节点和边文件
gephi支持多种格式的文件导入,这里以CSV文件格式为例子,进行导入CSV格式的节点和边文件,这里要求边文件必须包含源节点和目标节点,节点文件必须包含一个唯一标识节点的ID列。
这里我以专利实体共引数据进行展示,在专利实体共引中,每个节点表示一个专利文件,节点之间的边通过实体共引关系构建,其中边文件结构如下,source列表示源节点,target表示目标节点,sim_score是相似度得分,inter_count和union_count是边附属数据。
注意:gephi要求边文件必须包含source,target列,否则无法识别边数据文件。节点需要包含id列。
其中,节点文件结构如下,其中id列和上述的边文件的source,target列对应,其他的列为节点的属性。
二、使用gephi导入上述边和节点文件
1.打开gephi软件,新建项目
打开gephi软件,点击File->New Project创建项目,进入到gephi的工作主页面。
2.导入边数据
创建完成项目之后,选择Data Laboratory进行数据导入,选择Import Spreadsheet导入Excel/CSV格式的网络文件(node或者edge文件),
下面是导入边文件数据,Import AS应该选择为Edge table,表示将当前导入文件视为边数据文件。
、 点击Next之后,然后是设置数据格式,这里自行根据对应的数据类型设置即可。
接着点击Finish完成边文件导入,然后配置图的相关数据,Graph Type用来配置图是否为有向图或者无向图。
最后完成边的导入,此时的节点属性还没有导入进去,下一步需要进行节点数据的导入。
3.节点文件数据导入
和导入边文件一样,此时Import As选择Nodes table,表示将导入的CSV文件识别为节点数据。
接下是选设置图属性,这里需要设置Append to existing workspace,否则导入节点数据的时候会将之前的边数据覆盖。
4.进行数据可视化
点击Overview即可进入可视化界面,在左边属性栏可以自定义节点颜色。
总结
本文讲解了使用gephi软件导入网络数据并进行可视化,Gephi是一款开源的网络可视化软件,可以帮助用户导入网络数据并进行可视化分析。