如何用VOSviewer分析CNKI数据?

原创 2017年11月12日 00:00:00

学会了用VOSviewer分析Web of Science数据后,想不想知道如何用它分析中文文献?本文用CNKI数据做样例,一步步教你实现步骤。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

(由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有需要,请点击文末的“阅读原文”按钮,访问可以正常显示外链的版本。)

疑问

自从写了《如何快速梳理领域文献》一文后,不少读者留言或者来信问我一个问题:

如何可视化分析中文文献呢?

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

我之前没有用VOSviewer做过中文文献的梳理,所以还真不知道VOSviewer是否有这个功能。

但是我在博士毕业论文里用Citespace分析过中文文献,所以就用我最有把握的答案做了答复。

0?wx_fmt=jpeg

不过,随着问这个问题的人越来越多,我也来了兴趣:VOSviewer到底能否分析中文文献数据呢?

怀疑的原因,是因为之前在网上查资料时,看到的好像都是英文分析结果。而且VOSviewer的作者都是外国人,所以我不确认它对中文文献是否友好。

0?wx_fmt=jpeg

于是,我决定验证一下。

验证的方法,不是直接拿软件来尝试,而是查文献。

验证

有句话,叫“在有鱼的地方钓鱼”,我觉得是至理名言。

如果有人用VOSviewer做过中文文献分析,你觉得这样的结果更可能在哪里出现呢?

新闻?博客?……不,一定是科研论文,而且是中文论文里。

我们到CNKI数据库里找找看。

在CNKI首页,以“VOSviewer”作为主题词检索。获得了以下结果。

[图片上传失败…(image-6eb6aa-1510491971990)]

看来将VOSviewer作为研究工具的论文还真不少呢。

我们从标题寻找其中更有可能使用中文文献数据的论文,于是找到了这篇《2010年中国档案学研究热点的知识图谱分析》。

[图片上传失败…(image-37128c-1510491971990)]

看了摘要,确认该文使用中文期刊数据,分析工具为VOSviewer。

于是我们下载原文看看。

在文中显著位置,我们看到了这幅图。

0?wx_fmt=jpeg

这幅图说明,VOSviewer不仅支持中文文献分析,而且至少从2011年就支持了。

好了,我们的疑惑解决了——VOSviewer可以分析中文文献数据。

自然地,下一个问题就是:

该怎么做呢?

数据

第一步当然是收集数据。

我们继续使用CNKI。这次我们以“图书情报知识”(情报学领域核心期刊之一)作为“文献来源”检索词搜索。

[图片上传失败…(image-f48443-1510491971990)]

获得的结果,有4700多条。我这里连接网速不够快,4700多条文献记录都下载下来,需要很久。咱们精炼一下,只选择2016年的数据。

[图片上传失败…(image-2bd408-1510491971990)]

2016年的记录,一共有101条。我们每次50条,不断翻页,全部勾选。

[图片上传失败…(image-5bdff-1510491971990)]

勾选完毕后,选择“导出/参考文献”。

[图片上传失败…(image-d85bb3-1510491971990)]

在屏幕的左侧,我们可以看到不同的导出类型。

问题来了,该导出哪一种呢?

这时我们打开VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。

0?wx_fmt=jpeg

这里我们看到了Web of Science, Scopus, PubMed, RIS等格式。

我们的目标,是取CNKI导出格式,与VOSviewer导入格式的交集。

结果令人很苦恼——交集为空。

到这里,我大概知道为什么这么多读者发问了。不少人可能在CNKI上做到了这一步,然后就不知道该怎么办了。

其实你不必焦虑。因为文献记录格式之间,是可以转换的。

[图片上传失败…(image-364027-1510491971990)]

我们选择其中的Endnote格式,导出。

[图片上传失败…(image-55ad07-1510491971990)]

根据提示,存储导出的txt文件。

我们打开这个文本文件,看看内容。

0?wx_fmt=jpeg

经检验,数据完整导出。下面我们就要尝试格式转换了。

转换

我们的目标,是把数据转化为VOSviewer可以支持的格式类型。

我们打开Endnote。

0?wx_fmt=jpeg

从主菜单里,选择“导入(Import)”。

0?wx_fmt=jpeg

在弹出的窗口里,浏览并找到我们刚刚从CNKI导出的txt文件。

0?wx_fmt=jpeg

注意,此时不要直接导入文本文件,否则导入结果是空的

我们需要调整一下选项。点击文件浏览窗口左下角的“Option”。

0?wx_fmt=jpeg

点击其中的第一项,可以看到许多选项。Endnote作为老牌的文献管理工具,支持的数据格式很丰富。

0?wx_fmt=jpeg

选择“Endnote Import”。这样Endnote才知道,我们导入的,是Endnote自己的交换格式。

0?wx_fmt=jpeg

点击确定后,你就能看到100余篇文献正确导入进来了。

0?wx_fmt=jpeg

我们在这里对文献做粗略筛选。略去“卷首语”和重复文章,同时略掉没有作者的(一般是征稿启示等内容)文章。

0?wx_fmt=jpeg

筛选后的文献选中,选择“导出”(Export)。

0?wx_fmt=jpeg

Endnote会提示我们导出的选项。

0?wx_fmt=jpeg

我们把输出的文件名设定为有意义的名称。注意要把“Output Style”选择为“RIS”格式。

如果你的菜单里面没有“RIS”格式,可以先选择“Select another Style”。

0?wx_fmt=jpeg

然后你会看到许许多多的导出格式选项,下拉列表到“R”开头的区域,找到“RIS”。

0?wx_fmt=jpeg

选择后,“RIS”就被添加进来了。

默认导出文件扩展名是txt。我们将其修改为ris,以方便VOSviewer识别。

我们打开RIS文件看看内容:

0?wx_fmt=jpeg

可以看到,元数据都被保留,但是组织格式发生了变化。

至此,利用Endnote转换文献记录格式环节顺利完成。我们终于可以愉快地分析CNKI文献了。

分析

在VOSviewer中选择“Create”。会弹出以下对话框。我们选择第二项。

0?wx_fmt=jpeg

然后我们需要选择导入文献的类型和位置。

0?wx_fmt=jpeg

点击“RIS”标签页,利用文件选择器,定位到刚刚Endnote导出的RIS文件上。

0?wx_fmt=jpeg

下面选择分析类型,我们选择作者共现(Co-authorship)分析。

0?wx_fmt=jpeg

因为文章篇数太少,我们不得不把阈值定低一些。

0?wx_fmt=jpeg

弹出的对话框里,我们可以依据实际情况,把某些记录过滤掉。这里我们选择保持不变。

执行后,就能看到Co-authorship分析结果了。

0?wx_fmt=jpeg

我们放大结果图,看看细节。

0?wx_fmt=jpeg

图中中文显示一切正常。

至此,咱们利用VOSviewer分析CNKI文献记录的演示完成。

小结

回顾一下,本文主要介绍了以下内容:

  1. 我们确认了VOSviewer不止可以分析英文文献,也可以分析中文文献;

  2. 验证猜想,需要找证据。找证据的关键,是在最可能的地方着手搜索和挖掘;

  3. 文献记录的格式多种多样,但是其间大多是可以转换的。Endnote作为桥梁,可以帮我们把CNKI的导出结果转换为VOSviewer需要的RIS格式。

讨论

读过本文后,你是否了解如何用VOSviewer分析中文文献数据?你之前做中文文献可视化分析时,用过不同的方法吗?它们是否更有效和便捷呢?欢迎留言,把你的经验分享给大家,我们一起交流讨论。

这里给你留个思考题:如果要做引文分析,CNKI的数据可以吗?希望你能亲自动手尝试一下,把结果反馈给我。

如果你对我的文章感兴趣,欢迎点赞,并且微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。

如果本文可能对你身边的亲友有帮助,也欢迎你把本文通过微博或朋友圈分享给他们。让他们一起参与到我们的讨论中来。


如果喜欢我的文章,请微信扫描下方二维码,关注并置顶我的公众号“玉树芝兰”。

0?wx_fmt=jpeg

如果你希望支持我继续输出更多的优质内容,欢迎微信识别下方的赞赏码,打赏本文。感谢支持!

0?wx_fmt=png

欢迎微信扫码加入我的“知识星球”圈子。第一时间分享给你我的发现和思考,优先解答你的疑问。

0?wx_fmt=jpeg


如何用VOSviewer分析CNKI关键词共现?

用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。(由于微信公众号外部链接的限制,文中...
  • nkwshuyi
  • nkwshuyi
  • 2018年01月05日 00:00
  • 67

CiteSpace学习笔记

现在在跟导师在做和文本挖掘及可视化相关的项目,因为一个偶然的机会(随缘)接触到了CiteSpace这款软件。我们主要研究的文本内容是科技文献,所以这款软件特别合适。 CiteSpace是陈超美教授使...
  • qq_33924155
  • qq_33924155
  • 2017年03月16日 15:43
  • 1437

CNKI PDF全文下载脚本

CNKI PDF全文下载脚本    众所周知,PDF文档是当前电子文档发行的事实标准,其格式标准、安全性高、阅读器众多。特别是在学术领域,PDF 是全球通用的文献格式。然而,我们平时使用的主要文献检索...
  • miaoqiucheng
  • miaoqiucheng
  • 2016年10月04日 11:30
  • 2444

用pandas分析百万电影数据

用pandas分析电影数据 Lift is short, use Python. 用Python做数据分析,pandas是Python数据分析的重要包,其他重要的包:numpy、matpl...
  • xiaopihaierletian
  • xiaopihaierletian
  • 2016年11月03日 20:35
  • 854

如何用Python进行大数据挖掘和分析

互联网创业离不开数据,如果能自己做个数据爬虫,那岂不是一件很美好的事情吗?  其实自己做数据挖掘不是梦,学点Python的基本功能,5步就能让你成为一个爬虫高手!...
  • linglong911224
  • linglong911224
  • 2017年06月14日 14:45
  • 260

批量下载CNKI

利用 http://search.cnki.com.cn/search.aspx?q= 做入口,等号后边接文章全名,支持模糊搜索,一般第一条就是想要的。 用浏览器做入口,可以先批量打开网页。鼠标单击下...
  • jiyuanyi1992
  • jiyuanyi1992
  • 2015年06月25日 23:23
  • 1245

CNKI E-Study与Endnote 的参考文献题录互导

CNKI E-Study中的参考题录导入到Endnote 在CNKI E-Study中,选中所要导出的参考文献,右键选择"导出文献题录" 然后在样式过滤器中选择"Endnote",然后...
  • marstonyjiang
  • marstonyjiang
  • 2016年08月25日 09:31
  • 4000

用 python 做数据分析:pandas 的 excel 应用初探

大毛 岂安科技业务风险分析师 多年订单业务反欺诈经验,负责岂安科技多款产品运营工作。 上回笔者分享过一些 pandas 的常用数据查询语法,但是数据查询对于 pandas 而言...
  • bigsec
  • bigsec
  • 2018年01月16日 16:39
  • 18

产品经理如何用数据分析发现问题

大数据产品经理如何用数据分析发现问题
  • zhongyangzhong
  • zhongyangzhong
  • 2017年03月16日 14:06
  • 699

Linux系统下便捷使用中国知网的方式

本篇文章讲解在linux平台下合理使用中国知网的方式,包括:论文下载,文件名乱码处理等内容,并提供相应代码。...
  • mowangajimide
  • mowangajimide
  • 2017年01月07日 00:02
  • 589
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:如何用VOSviewer分析CNKI数据?
举报原因:
原因补充:

(最多只允许输入30个字)