文/编 胡露旖/魏祯
指导 付慧真/刘爱原
信息资源管理系
浙江大学公共管理学院
地理空间分析在地理学和制图学方面有着悠久的历史,其目的是回答在哪里发生的问题,以及它对邻近地区的影响。科研产出的地理可视化可以使我们直观明确地了解论文等其它科研文献的地理产出分布,从而帮助我们进一步了解某一地区的科研成果概况。
鉴于目前并未有相关软件可以直接形成地理可视化图谱,我们将介绍Loet Leydesdorff的相关软件cities1.exe和cities2.exe,以Pajek作图实现科研产出的地理可视化。
那本次推送的主要流程就是:数据准备>提取地理坐标信息>Pajek可视化操作。
01
教程工具
数据:来自Web of Science的数据
软件:
cities1.exe和cities2.exe下载地址:https://www.leydesdorff.net/maps/
GPS Visualizer’s Address Locator:
https://www.gpsvisualizer.com/geocoder/
Pajek下载地址:
http://mrvar.fdv.uni-lj.si/pajek/be2.htm
02
原始数据获取
数据说明:后续操作软件cities1.exe和cities2.exe仅接受来自Web of Science和Scopus的相关数据,故本次操作以来自Web of Science的相关数据为例。
检索策略:这次的检索主题和范围是在Web of science核心合集中,检索的主题为computer science,设定出版年限为2011年,文献类型为Article,参见图1。
图 1
得到相关数据843条,本次实验仅下载前500条作为尝试。下载、保存前500条数据的“全记录与引用的参考文献”为纯文本格式。
图 2
由于cities1.exe能处理的数据为ANSI/ASCII格式,且文件名称为data,所以将下载好的savedrecs.txt另存为ANSI/ASCII格式的data.txt文件,到这一步原始数据的获取已经完成。
03
数据地理坐标化
将得到的data.txt以及下载好的cities1.exe和cities2.exe放置在同一文件夹中,双击cities1.exe运行程序,得到DOS界面如图3。
图 3
选择N,可得到图4界面。
图 4
按任意键继续运行,等待几十秒,可得到图5界面。在这一界面中,我们可以根据数据中城市名称总数的最小百分比来设置阈值,或者设置最小出现次数。这次实验以程序设置的默认参数为例继续往下运行。
图 5
之后,cities1.exe快速运行出其所获得的地址信息,当界面停止运行时,在回答“Do you wish to leave this routine now?(Y/N)”这一问题中,输入Y退出程序。
图 6
cities1.exe运行之后,文件夹中会出现大量生成的文件。
图 7
点击名为cities文本文件,打开这一文件,可获得相关论文的地理城市信息。这一信息是cities1.exe从论文相关信息的CS字段或corporate source中提取得到的。
图 8
打开cities.txt文件,将数据粘贴到GPS Visualizer’s Address Locator中的Input中进行Geocoding处理,并将界面中的Source改为Bing Maps。为了得到这些地址的地理坐标,需要输入API key。这里使用免费申请的Bing map及其API key进行分析:
ArZ1RleCSjcbQC4JR1zB11f300oHZPFUe4S9o1b4jKcxaZOrzXW2Cua24kgHEE9M。
设置好参数后单击Start Geocoding。此时,在Result as text中就会动态出现已经处理过的数据及其状态。
图 9
等待数据分析结束后,将Result as text复制到新建的命名为geo.txt文档,并将其保存为UTF-8格式。将geo.txt文档放置在cities1.exe和cities2.exe的同一文件夹,进行下一步分析。
图 10
点击cities2.exe,进行下一步数据处理。
图 11
运行完毕后可得到cities.kml和cities2.kml等相关文件,可以使用多种方式对得到的结果进行可视化操作。
图 12
由cities1.exe和cities2.exe生成的cities.kml和cities2.kml可用于Google Earth和Google Maps进行分析,Inp_gps.txt可用于GPS Visualizer进行分析,cities.paj可用于Pajek分析。
04
Pajek可视化
打开Pajek,依次单击File→Pajek project file→Read F1,读取cities.paj文件。在Pajek界面下依次单击File→Network→Read,读取从网站https://www.leydesdorff.net/maps/上下载的COAST.NET文件,完成后再菜单中单击Networks→Union vertices。最后单击画笔形状按键,生成地理可视化结果。
图 13
05
总结
Loet所开发的cities1.exe和cities2.exe可有效提取相关论文的城市信息,并将其坐标化。其运行完成后生成的相关文件,可用于后续多种软件的可视化呈现。以城市作为分析单位的研究尺度相对较小,因此这类小工具适用于针对于某一地区数据量较小的数据集合。
相关参考:
①https://www.leydesdorff.net/maps/#_ftn1
②李杰. 科学知识图谱原理及应用——VOSviewer和CitNetExplorer初学者指南