基于文献可视化分析软件CiteSpace制作文献知识图谱
文章是为了记录日常科研工作用到的一些技术、方法,欢迎各位交流指正。
CiteSpace所需软件下载
CiteSpace安装
官网链接:https://citespace.podia.com/
如下图所示
1、选择第一个Basic版本,点击View product
2、点击Download
3、下载后打开文件夹,双击安装程序
4、按照程序安装即可
5、安装后文件如图,红色框选出的文件即为CiteSpace应用程序,会自动添加到桌面,如果没有则自行复制快捷方式到桌面
6、安装结束
Java环境安装
下面是Windows操作系统的配置示例:
下载JDK:从Oracle官方网站或者OpenJDK网站下载适用于Windows的JDK安装程序。
安装JDK:运行下载的JDK安装程序,按照安装向导完成安装过程。
配置环境变量:
打开控制面板 -> 系统和安全 -> 系统 -> 高级系统设置 -> 环境变量。
在系统变量中点击“新建”,变量名输入JAVA_HOME,变量值为JDK的安装路径,例如:C:\Program Files\Java\jdk-11.0.12。
在系统变量的PATH变量中添加JDK的bin目录,例如:在原有的PATH变量后面加上;C:\Program Files\Java\jdk-11.0.12\bin。
验证配置:打开命令提示符(cmd)或者PowerShell,输入java -version和javac -version命令,查看是否正确显示JDK的版本信息。
开始前的准备工作
在工作目录下新建四个文件夹分别命名为:input、output、data、project
文献导出
Web of Science导出
1、打开Web of Science官网,挂学校VPN或者自行登陆。
官网链接:https://www.webofscience.com/wos/alldb/basic-search
2、在主题框搜索需要检索的文献主题并点击导出
3、选择纯文本文件
4、这里可以选择页面上的所有记录或者自行选择记录条数,最多1000条,记录内容也可以根据需要选择带摘要或者不带摘要
5、点击导出,弹出保存框,这里文件名需要格外注意,必须按照图上格式命名,download_xx,xx可以随意更改,点击保存即可。
中国知网导出
1、打开中国知网,搜索相关主题词,可以看到如下界面
2、勾选需要文献,点击全选然后手动翻页,最多选择500篇文献,如果超过500就分几次导出
3、点击导出- Refworks格式-导出,导出后格式为txt
4、命名为download_xx,位置放在input文件夹即可
CiteSpace可视化操作
1、双击打开CiteSpace软件,出现命令行黑框,等待几分钟左右,会自动弹出软件界面。注意:软件使用过程中不能够关闭命令框!
2、弹出软件界面如图,点击agree进入主界面
主界面如图
3、点击data-import/Export进行数据转换
根据所需数据库类型选择相应转换方法,一般用到的是WOS和CNKI
下面分别是WOS和CNKI的操作界面和步骤
重要:提示转换成功后将output文件夹中的文件全部复制到data文件夹中!
4、新建project
工程名自定义,工程文件路径和数据路径分别选择前面创建好的project和data文件夹
设置好后点击Save保存
5、在Time Slicing处选择想要操作的时间段,一般默认会把文献所在的时间段选择
根据界面右边的Node Types选择需要可视化的内容,可以选择根据作者、机构、城市、关键词等,这里不仅可以单独选择,也可以进行复合选择可视化,即同时选择作者、机构等
在界面右下方Pruning栏中勾选需要的算法,一般我按照图上勾选。这里CiteSpace提供了两种剪枝算法,Pathfinder和Minimum Spanning Tree。剪枝算法目的是为了让图谱可读性更高,如果节点和连接线过于复杂则需要采用
在剪枝策略上,Pruning slice network是对每一时间段的网络进行剪枝,Pruning the merged networks是对整体网络进行剪枝。两种方法可以同时选择,实现在每一个时间段上剪枝之后再对整体网络进行剪枝
点击Go运行
8、弹出对话框选择Visualization进入可视化界面
9、进入正题!
可视化界面操作
首先重要的一点,右边的操作栏窗口不要关闭,更方便操作。
调整节点显示
1、显示方式
在Views中选择显示方式,一般我选择Tree Rings,根据节点大小进行显示。Cluster是聚类显示,Uniform是同一格式显示。
2、第一个框中分别为显示阈值设置,值越小则显示的Label标签越多;字号大小设置;节点大小设置。
第二个框中为取消重叠选项,可以选择Cluster聚类和Node节点的标签是否重叠。
背景黑白色选择
框选区域黑色按钮则为黑色背景、白色则为白色背景
节点及标签样式调整
1、框选区域从上到下依次为菱形、圆形、方形显示,个人认为圆形比较好看
2、框选区域分别为左上角详细信息栏文本颜色、节点显示文本的颜色、重叠文本的颜色、相似文本颜色、聚类文本颜色
聚类
1、有四类聚类方式,从左到右依次为一件聚类,自动布局和风格、根据Title标题聚类、根据KeyWords关键词聚类、根据Author作者聚类、TKA标题、关键词、作者全部聚类。聚类后建议把Label标签阈值拉到最大,之前的标签就不会显示了。
2、聚类数量显示设置,输入范围则显示自定义数量聚类
TimeLine时间轴显示
框选区域分别为普通模式显示、时间线TimeLine显示,时间线显示如下图
作者被引半衰期
该操作需要在节点类型中选择了Author才可以统计,点击Export-Network Summary
单击HalfLife中的某一行,会自动按照该列值排序,具体被引半衰期含义就不作介绍了,值越高说明作者被引持续时间长。
导出PNG格式图片
那么针对上面操作我们需要将每一步图都保存下来,就需要点击这个类似播放器的图标,自定义名字后点保存就好了,如果名字后缀不小心删掉了,可以对文件重命名加上后缀.PNG就会恢复成图片格式了。
至此,基本可视化操作结束了,更多的操作等以后有空了再更。
感谢阅读。