知识单元文献时间序列分析
1 知识单元文献时间序列分析
数据时间序列分析即是对文献按照某一时间区域划分,进行文献数量统计的过程。即是将知识单元的频次统计按照时间进行分组统计汇总。mk中timeSeries()方法就是针对文献进行时间序列分析,括号中可以传递WOS字段标识,借助DataFrame数据结构,输出按照输入的字段和时间(默认为年份)进行分组汇总的结果。
比如将文献按照年份进行分析,探究搜索领域的论文发文量和累计发文量。由于默认汇总结果是按照年份降序排序,但是文章累计量是升序增加,所以添加发文累计量字段sum_acc时,需要将汇总得到的结果进行反序[::-1],输出结果如下。由于没有汇总字段,需要手动添加,cumsum()方法就是对指定字段的数值进行累加操作。
数据准备完毕后就可以进行图形绘制,需要留意一般情况下,每年的发文量和累计发文量是相差一定的量级,绘制在同一y轴侧展示效果较差,实际展示中往往需要绘制同x轴双侧y轴图,代码及输出结果如下。