Data数据园1.1-数据收集利器

正文:目前针对CNKI、CSSCI和Web of Science下载的数据进行提取的软件几乎没有,因此,“学术点滴”号开发了“Data数据园”软件,如下:

在这里插入图片描述

其中“Data数据园”软件【处理CNKI、CSSCI】。

“CO-OC”软件【其中一个小插件处理Web of Science】

该软件能够将“中国社会科学引文索引(CSSCI)”、“中国知网(CNKI)”和“国家社科基金项目数据库”中的数据进行提取分析。

本文以“中国社会科学引文索引(CSSCI)”为例进行讲解,中国知网(CNKI)类似,而“国家社科基金项目数据库”已经讲解完成,链接如下:《国家社科基金项目数据库》。

中文社会科学引文索引英文全称为“Chinese Social Sciences Citation Index”,缩写为CSSCI。由南京大学 中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况,是我国人文社会科学评价领域的标志性工程。

其与CNKI是两个完全不同的数据库,并不是CNKI中的CSSCI,请注意区别。

案例如下:

从“中国社会科学引文索引(CSSCI)”下载的数据如下:

每一篇文献所有的题录

目前利用“Data数据园”软件可以提取除参考文献的所有字段 。

以“关键词”为例,进行提取,如下:

1 把下载的所有文本文档放入一个文件夹中,本软件会自动合并:

2 打开“Data数据园”软件,并将上述文件夹放入“文件路径”中,“提取单元”对应空格写入要提取的单元,参照本文第一张图,比如“关 键 词”。

注意:提取的字段有的存在空格,记得加上,比如关键词中间具有空格。

3 点击提取,结果如下:

可见,关键词已经全部提取完成。

同样的方法,你还可以提取:

【来源篇名】【英文篇名】【来源作者】【基 金】【期 刊】【第一机构】【机构名称】【第一作者】【中图类号】【年代卷期】【关 键 词】【基金类别】

上述是针对“中国社会科学引文索引(CSSCI)”数据库的操作。


当然,你也可以针对“中国知网CNKI”数据库进行提取。

在下载数据时,为了方便一次下载,多次使用,这里我们需要下载“Refworks”格式的文献,以方便CitaSpace软件使用。

下载完数据后,方法和提取CSSCI数据操作相同,但是需要改变“提取单元”字段。

CNKI“Refworks”格式字段如下:

利用“Data数据园”软件可以提取出所有字段【红框框起来的】 。

其中比较常用的有:

A1 作者

AD 徐机构

T1 标题

JF 期刊

YR 年份

K1 关键词

方法同上,不再演示。


截止目前,“学术点滴”号已经开发了 五款原创软件。针对文献计量与数据可视化已经形成了一个完整的体系。具体包括数据收集与去重,数据清洗和数据可视化。具体软件如下:

利用“Data数据园”软件可以去重,这里我不讲,大家自己思考,如何去重。

每个软件步骤都极其简单,可谓是“一键做所有,省时有没有”。

以前从收集数据到去重、清洗数据、作图,需要半个月,现在,你只需要半小时,甚至不到半小时。

有位使用者说,用了本号的软件,最花费时间的地方在于打开Excel表格所用时长。

当然,本号开发的所有软件,均免费使用。
截止目前已经公布了“CO-OC”、“SciHub Easy”、“GIGO”、“科研数据金库”、“Data数据园”软件,大家后台回复对应软件名字,获取对应软件,对应的教程均在本号以往推文里,自行寻找。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值