【科学文献计量】知识单元地理数据可视化(作者研究机构点数据和作者所在国家区域面数据)

本文介绍了如何使用Python进行知识单元的地理数据可视化,包括地理面数据和点数据的处理与展示。通过遍历和处理文献数据,提取作者所在国家/区域(面数据)和研究机构(点数据)。面数据处理涉及空值检查和清洗,最终利用pyecharts库绘制地图。点数据则基于(corresponding author)标志获取机构信息,进行频次统计和可视化。文章还提到Excel的三维地图功能作为另一种可视化方式。
摘要由CSDN通过智能技术生成

知识单元地理数据可视化(作者研究机构点数据和作者所在国家区域面数据)

知识单元地理数据可视化

地理数据包含了地理点数据和地理面数据。在文献中,地理面数据表示作者的国家或者区域,地理点数据表示具体的地址,即作者的研究机构所在的地方。

1.1 地理面数据可视化

重新读入数据,显示前两行,由于字段过多,要找的位置信息字段被省略。为了方便查找作者所在的位置信息,可以通过遍历行和行标题,借助输出提示,找到地址对应的字段名称。
在这里插入图片描述

确定地理信息所在的字段后,从元素中提取出想要的信息。文献作者中会存在多人的现象,书中采用通讯作者所在的地址作为地理信息进行数据提取。通过输出结果,发现国家或者地区都是在指定字段元素的最后面,但是也要考虑到该字段有空值的情况。
因此,需要先判断字段中是否存在缺失值,如果不存在就进行数据提取,将字符串数据按照逗号进行分割,截取最后一项,否则就保持默认空值。进一步确定空值数量,确保不影响整体,否则缺失值量过大,说明按照此种方式提取地理信息方式不妥,需要更换提取策略。输出结果有56个缺失,占到总体文献数量的0.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值