如何用R分析CNKI文献关键词词频?

本文介绍了如何使用R语言而不是Citespace或Python,来统计CNKI文献中关键词的词频。通过处理从CNKI导出的数据,设置停用词,过滤并排序关键词,最终发现"大数据"是最突出的关键词,并用ggplot2进行可视化展示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

疑惑

如何用VOSviewer分析CNKI数据?》一文发布后,有同学问我:

王老师,我有个问题,我用cnki导出关键词后,想统计关键词的词频,我应该用什么样的工具?如果不利用citespace和python,做出excel那种的统计表格,该怎么做呢?

这个问题,我觉得很有意思。统计关键词的词频,确实也用不到Citespace。

那我们就来试试看,怎么做才好。

数据

首先检索文献。我这里检索的是2017年知网收录的“竞争情报”相关的论文。一共154篇。

img_5d38d232e470d9c632f2ad565697d082.png
image

下面就是手动全选,翻几页,选完全部。

img_8c89c7e065e09338be793ad642c516e0.png
image

然后导出文献。

img_2daf8eedad6d9938b500273c38b17ab2.png
image

默认的格式显然不符合我们的要求,因为根本不包含关键词。我们可以选择“自定义”。

CiteSpace 5.6是一个用于文献分析的软件工具,可用于识别和分析CNKI(中国知网)文献。下面是如何使用CiteSpace 5.6来分析CNKI文献的步骤: 1. 数据准备:从CNKI数据库下载需要分析文献,并将其导出为EndNote(.enw)格式。确保文献包含作者、标题、关键词、摘要和引用等信息。 2. 软件安装:将CiteSpace 5.6安装到计算机上,并确保已下载和安装了Java运行时环境。 3. 打开CiteSpace 5.6:双击CiteSpace 5.6图标启动软件。 4. 导入文献:在CiteSpace 5.6的菜单栏中选择"File",然后选择"File"或"Files",以导入EndNote格式的CNKI文献文件。 5. 数据预处理:在导入文献后,CiteSpace 5.6会自动进行数据预处理。这包括数据清洗、标准化和去重。根据文献的数量和大小,这个过程可能需要一些时间。 6. 可视化分析:在数据预处理完成后,用户可以使用CiteSpace 5.6的各种功能进行可视化分析。例如,用户可以生成共词图、合著网络图、引文网络图等来观察文献之间的关系和联系。用户还可以根据关键词或作者对文献进行筛选和排序。 7. 结果解读:通过观察和分析生成的图形和数据,用户可以获得对CNKI文献的更深入的理解。例如,用户可以发现热门研究领域、重要作者、引用网络等。这些结果可用于指导进一步的研究和分析。 总之,CiteSpace 5.6是一个功能强大的工具,可以帮助用户对CNKI文献进行分析和可视化。通过使用CiteSpace 5.6,研究人员可以更好地了解CNKI文献之间的关系和趋势,并借此指导和支持后续的研究工作。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值