【科学文献计量】关键词的挖掘与可视化

本文档详细介绍了如何对外文和中文文献的关键词进行词频统计和可视化,包括使用词云图展示不同期刊关键词的特征。通过数据处理、筛选规则优化词云图,以及解决中文文献中的噪音数据问题。
摘要由CSDN通过智能技术生成

1 外文文献关键词词频统计与可视化

在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计。在回顾知识点的基础上,进一步进行可视化操作。可以新建一个ipynb文件,在导入功能库和文件后,为了查阅方便,只显示前两条记录。
在这里插入图片描述
直接把前面封装好的multi_element_count()函数复制粘贴过来,进行多元素字段的词频统计。
在这里插入图片描述
可将上述的频数统计结果,借用词云图可视化结果输出。首先需要将多元素字段频数统计的结果进行处理,形成绘制词云图的DataFrame数据格式,即第一列为标签字段中多元素的分类名称,第二列就为各类名称出现的频数统计。然后在将两列的数据合并,组成分类名称和频数一一对应的列表,即words变量(词云图的核心就是在于words变量的构造),如果有需求可以对图形的标题进行注解,比如这里将NAME赋值为ID,就是表明当前展示的词云图结果来自于ID字段。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值