本文章系统地介绍了 bibliometrix 包在文献数据处理中的几个重要但却经常被忽略的功能,包括数据合并、去重、切片和编辑。首先,文章探讨了
mergeDbSources
函数的功能,通过实例说明如何合并来自 Web of Science 和 Scopus 的文献数据,确保数据全面性和一致性。接着,文章介绍了duplicatedMatching
函数,展示如何在合并后的文献数据中查找和去除重复记录,以提升数据质量。随后,文章分析了timeslice
函数,探讨如何基于时间进行数据切片,使研究者能更直观地观察某一特定时期的学术发展趋势。最后,文章深入讲解了数据清理的两大函数——trim
和trim.leading
,并通过实例演示其在去除字符串空格和规范数据格式中的应用。
一、文献资料的合并
在文献计量学研究中,研究者常需要从多个数据库(如 Web of Science 和 Scopus