文/刘爱原 万雨秋
编/付慧真 万雨秋
信息资源管理系
浙江大学公共管理学院
今天要学的新软件就是UCINET,下面就是我们今天将要做出的作者合作网络图,表示了1999-2018年间《社会学研究》期刊收录文献的作者合作情况。

图1
事不宜迟就先来认识一下这个软件吧!
1
UCINET是什么?
UCINET (University of California at Irvine Network) 是一款功能强大的社会网络分析软件,最初由加州大学尔湾分校社会网研究的权威学者Linton Freeman编写。Google网站上的正版软件可以免费试用90天。UCINET内置大量网络分析指标,如中心度、位置分析算法、派系分析以及对网络假设进行检验的程度等,还包括常见的多元统计分析工具。
它的基本界面就是这样:

图2
主菜单的八个选项从左到右依次为:文件(File)、数据(Data)、转换(Tansform)、工具(Tools)、网络(Network)、可视化(Visualize)、选项(Options)、帮助(Help)。
第二排的9个图形快捷键从左到右依次为:

1. Exit:
退出UCINET程序

2. Excel Matrix Editor:
Excel数据矩阵编辑器

3. Matrix Editor:
建立UCINET本身的矩阵数据表;

4. DL-Editor—Import text data from spreadsheet:
数据语言编辑器,即导入文本文件,或者从Excel中导入文件,并保存为UCINET格式的数据;

5. Edit Text File:
编辑文本文件;

6. Display UCINET Dataset:
展示UCINET数据

7. Command line interface--aka Matrix Algebra:
直接调用矩阵算法

8. Visualize network with NetDraw (quickstart)

9. Visualize network with NetDraw:
导入NetDraw可视化程序,对网络数据进行可视化分析。
这些按钮一下子看不懂记不住都没有关系,反正所有软件都是用着用着就会了的嘛!下面就直接从例子中体会感受UCINET的用法吧!
2
数据准备
本次检索选用的数据库为中国知网,用图3所示的检索条件检索《社会学研究》在1999-2018年间发布的所有文章,共得到相关文献1403条,如图3。

图3
每次选择500条,以.xls格式分3次导出这1403条文献,并用Excel将这三个文件合并成一个文件,如图4。

图4
对文件进行清洗,如图5,如将“Author-作者”列的““中国社会保障体系研究”课题组系,杨团,唐钧,莫泰基,施育晓”替换为“杨团,唐钧,莫泰基,施育晓”,(当然本行后面的第一责任人一行应改为“杨团”,不过这一步对后面的操作并没有影响);无关文献和没有作者信息的文献也应该直接被删除。最后剩余有效数据共1362条。

图5
如图6,在Title-标题这一列的左边增加一列论文序号,为文章进行编号:论文1、论文2、论文3、论文4、…、论文1362。

图6
将“论文序号”和“Author-作者”这两列复制到一个新建的Excel工作表中,对作者列按图7、图8所示进行分列操作,注意由于中国知网数据分隔符的不统一性,在选择分隔符时需要同时选中逗号和分号。

图7

图8
分列后的结果将符合UCINET数据格式(Data format)中的Nodelist2 (woman event1 event2 …)格式。复制A2:N1363单元格,如图9,到这里,数据准备工作就完成了。

图9
3
生成UCINET网络文件
打开UCINET的DL Editor,如图10。

图10
按图11右侧所示在“数据格式(Data format)”中选择“Nodelist2 (woman event1 event2 …)”,将复制好的A2:N1363单元格粘贴到编辑框中。点击图11左侧所示按钮,全部作者将被显示在表格中。

图11
保存文件,以“1362”为其命名,如图12。

图12
被保存好的文件分别是1362.##h和1362.##d,如图13,其中1362.##h可以用UCINET软件打开。

图13
说说.##h文件与.##d文件:
一个单独的UCINET数据库实际上由两个物理文件组成。一个包含扩展名.##d,包含关于实际数据的信息;另外一个包含扩展名.##h,包含实际数据。而在键入一个UCINET数据的时候只涉及.##h文件,可以利用文件名,或文件名加上.##h的方式打开它,如“1362”或“1362.##h”。
用UCINET软件打开1362.##h文件,结果如图14。

图14
图14中显示在这1362篇论文(rows)中,共有1084位作者(columns)参与,这是论文和作者的2-mode矩阵。而用excel打开1362.##h文件则能更直观地感受到它们之间的矩阵情况,如图15。

图15
说说1-mode与2-mode网络:
1-mode:由一个行动者集合内部各个行动者之间的关系构成的网络叫做1-mode网络(1-mode network);
2-mode:由一类行动者集合与另一类行动者集合之间关系构成的网络称为2-mode络(2-mode network)。
接下来,按图16所示操作对1362.##h进行转置处理,即行列互换。

图16
得到1362-Transp.##h和1362-Transp.##d两个文件,以表格形式打开1362-Transp.##h,计算每位作者发表论文的数量,如图17。

图17
把前两列的数据取出,另存为1362att.xlsx文件,如图18。

图18
为了后续的使用,需要将“1362att.xlsx”转换为UCINET格式的文件,操作如图19所示。

图19
将得到作者发表论文数量的属性文件。然后,按图20、图21中方式把2-mode矩阵文件转化成1-mode矩阵文件,确保在Mode选中“Columns”代表以作者取模。

图20

图21
得到1362Columns.##h文件,这就是1084位作者-作者的1-mode矩阵,如图22。用excel打开以更直观地查看矩阵,如图23。

图22

图23
4
制作作者合作网络
点击“Visualize network with NetDraw”按钮,如图24,进入可视化界面。

图24
以图25、图26所示方式找到并打开1362Columns.##h文件。

图25

图26
得到具有1084个节点、1396个连接的作者合作网络,如图27。

图27
接着导入属性文件“1362att.##h”,如图28。

图28
属性文件导入后,Nodes列表下增加了“1362att”一行,如图29。

图29
按图所示方法以节点的大小表示作者的论文数量,如图30。

图30
可以调整节点的形状,使其为圆形,如图31。

图31
设置以连线的粗细表示作者间的合作频次,如图32。

图32
经过上述设置后的结果如图33。

图33
在图中标签太多影响阅读的情况下,可以用图34方法选择不显示标签:

图34
结果如图35:

图35
最后,保存网络图!

图36
可以将成图“1362.emf”插入word中,不论怎么放大缩小都不会改变它的精度。

图37
最后终于做出了这个图!这样大家是不是已经基本上熟悉了UCINET的操作流程呢,那它的其他功能就留给大家慢慢摸索吧!
拜拜!
参考文献:
[1]刘军.整体网分析:UCINET软件实用指南(第二版)[M].格致出版社:上海,2014:42-51.
注:本文版权归本公众号所有,转载请注明作者及来源
科研路上
陪你看见
陪你修炼
没时间解释了快关注
