热点分析图_2020年度教育部立项热点的词云图分析

2020年度教育部立项热点的词云图分析

吴良海

16f371cc094cb55fade85f25ebf35e90.png fdfdf823254932047e2cff9dd79bbad6.png 928419b98422ad4ec92b150ad924ec5d.gif

    作为三大基金之一,教育部人文社科基金的申报与立项广受学界关注。教育部2020年度立项的2622项人文社科基金,究竟哪些领域与方向的选题更受青睐与关注?能否通过严谨、精准而直观的统计分析予以展示,以期为未来基金申报与选题确定提供参考和指导?在这方面,词频统计和词云图分析可以“大展拳脚”。

    本文以2020年度教育部立项公示文件为原始依据,提供了基于Python的文本分析“五步法”。

一、获取原始数据

    首先登录教育部人文社会科学网主页(https://www.sinoss.net/),下载PDF格式的2020年度立项文件“2020教育部项目.PDF”。

二、启动Python编辑器

    打开Visual Studio Code编辑器终端,输入“ipython3”指令以启动IPython shell会话。

三、安装第三方库

  在终端中依次输入“pip install pdfplumber”(图1),“pip install xlwt”(图2),安装PDF格式文件转换为Excel格式文件必须的第三方库pdfplumber和xlwt。

905f31835f162359723af87ba354b6f3.png

图片1 安装pdfplumber

bd3e5dfece8ff76fe0696cef1f75614c.png

图片2 安装xlwt

四、编写代码

d44d4957e0ddf82257edc2b45725aee3.png

    运行过程见图3和图4。

a44144056173b71db1f2706467f91ed8.png

图片3 程序执行中

0a0f862b949ea46eed97b736abdb4631.png

图片4 程序运行结束

五、

    将“2020教育部项目.xls”转换为utf格式的文本文件“教育部20年度项目.txt”,并编写如下代码以绘制词云图。

8f659ddce09e64daeefeded7e9609828.png

    运行上述Python程序文件jybxm.py,即可得到教育部2020年度立项热点的词云图。

1cfc7e5eb1a6c7a3ce8f97f7e63a277f.png

图5  教育部2020年度立项热点的词云图 

    词频统计结果表明,2020年度教育部人文社科立项热点前十位依次是“大学生”、“大数据”、“粤港澳”、“青少年”、“一带一路”、“1949”、“人工智能”、“制造业”、“高质量”、“消费者”等(图6),图5的词云图展现犹为鲜明、直观。

f4dbf0d25b82ef7eab8ed21901b64577.png

图6  2020年度教育部人文社科立项热点:

词频统计前10位

·· THE END ··

 往期回顾:    熠熠美人蕉    派生天骄    清平乐    天山雪莲  编辑:杨露  审核:李娟 16f371cc094cb55fade85f25ebf35e90.png 3e4be480245af5867816f25f8248cd3f.png

实证会计入门一点通

fdfdf823254932047e2cff9dd79bbad6.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值