excel/vosviewer词频统计的方法

词频统计是进行词云图绘制的基础,我用的有两种简单方法,一个是excel统计,一个是vosviewer统计,后者更加方便准确。

1、excel统计词频

以在web of science核心集中下载的数据为例(选择制表符分隔文件导出),其中DE字段表示论文关键词。
可以看到关键词之间以英文分号+空格分隔开来;
在这里插入图片描述
使用excel的分列功能,按照指定分隔符分列;
在这里插入图片描述
分列之后将所有列的内容,合并到第一列中,使得所有的关键词都在这一列
在这里插入图片描述
接下来,需要对数据进行简单的处理,首先为了好看,把所有首字母都改为大写的,方法如下:
在右边新建一列,用下面的公式,就可以进行首字母大写替换,然后用这一列覆盖原来的一列就好了;

=REPLACE(T3,1,1,UPPER(LEFT(T3,1)))
T3指的是待转化的关键词所在的单元格

在这里插入图片描述
接下来,对这一列进行简单的去重,复制处理后的首字母为大写字母的一列,然后对这新的一列进行去重,使用excel的删除重复值即可,还可以注意一下是不是第一个就是字母,因为有的第一位是空格,那么就需要我们先删除前面的空格再转化字母大小写;
在这里插入图片描述
在删除时选择以当前选定区域排序;
在这里插入图片描述
接下来就可以进行词频统计,在新的一列中输入统计词频公式;

=COUNTIFS($A$2:$A$389,B3)
$A$2:$A$389指的是所有关键词的范围,B3指的是待统计的词所在的已去重列的单元格

在这里插入图片描述
进行降序排序,得到词频统计表:
在这里插入图片描述
此外也可以对关键词这一列进行降序排序,这样可以人工检查是否仍然存在一个相似度很高的词,比如单复数问题,时态问题的词,有的话将他们合并后修改一下频次。

2、vosviewer统计词频

很明显,通过excel来统计词频,需要手动的地方很多,效率低,vosviewer提供了帮助计算词频的功能,但是隐藏的比较深,找到的步骤如下:
首先,vosviewer只能识别特定格式的数据,如果需要统计的是wos的关键词就很好解决,但是需要统计的如果是别的东西,可以把需要统计的关键词复制到wos下载数据的“DE”字段下就可以,系统识别的字段名称,需要注意的是你自己数据的关键词之间的间隔符和wos标准格式是否一致。替换好之后,具体步骤如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
到这一步之后,右击界面,然后选择导出所选择的关键词即可;
在这里插入图片描述
可以看到,vosviewer导出的数据是对关键词进行一些近似词检验处理的,将结果与excel的结果对比就可以看出来,更加省心,还可以看到每个词与其他单词的连接强度;
在这里插入图片描述

  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值