词频分析及常用工具比较研究.pdf
图书馆学刊 2016 军第6 期
TUSHUGUANXUEKAN NO.6 , 2016 …llfal萄园揭!'
词频分析及常用工具比较研究*
左丽华
(浙江工业大学图书馆,浙江杭州I 310023)
[摘 要]首先梳理了词频分析的一般过程并对现有词频分析工具总结归类。在此基础上,从软件基本信息、支持
数据类型、数据预处理、数据分析与结果导出等方面对国内常用词频分析工具Bibexcel、 CiteSpace 和SATI进行了比较
分析。并以WOS数据库为数据源,对3 个软件实际分析结果进行比较,以期为科研人员使用词频分析方法提供有益
的帮助。
[关键词]词频分析 Bibexcel CiteSpace SATI
[分类号]G252.8
策略的制定对最后的结果分析有直接影响;检索并评估检索
1 词频分析及现状
结果,如果首次检索结果不理想需重新调整检索策略再次进
词频分析是文献计量学中传统的和具有代表性的一种
行检索:数据采集下载,通过人工判读删除无用数据,然后下
内容分析方法,基本原理是通过词出现频次多少的变化,来
载数据。数据清洗加工,词频分析最终结果的可靠性很大程
确定热点及其变化趋势[町,目前巳经在各学科领域得到广泛
度上依赖于原始数据的准确性,清洗对下载的数据进行筛
应用。笔者通过对国内文献调研发现,国内研究人员多运用
选、去重和勘误,常常需要人工识别。最后是数据分析,借助
一种分析工具对特定学科领域某个时间段的文献所使用的