需要的作者共现、关键词共现次数
使用到的工具包括python和gephi
注意:gephi的安装需要java支持。
1、数据准备
在对某领域的学术论文进行描述性统计时,最常需要的是统计关键词/作者出现次数/发文数,关键词/作者共现次数。
数据处理方法->: 词频统计和共现分析
代码见以上的链接,本节展示处理前后的结果。
1.1 作者词频
如上图所示,列表中一列数据为作者,每篇文章一行,一个单元格包括该文全部作者,且用英文分号隔开。运行代码之后,生成表格,手工降序排列即可。
1.2 作者共现
该链接的第二部分统计共现,需要一份文件名为一行作者.txt的文件,如下图。生成方法时手工将作者合并为一行,每篇论文直接通过“//