本次数据为地级市、省级、中央三级数字经济60个词频、扩展词频,三类数据更新至2024年
本次分享的数据对“数字经济”词频数据进行更新,分别统计数字经济政策词频A、数字经济政策词频B,目前三类数据已更新至2024年,包括60个明细词汇、以及60个明细词汇的扩展词汇统计
一、数据介绍
数据名称:数字经济政策-60个相关词频
数据范围:地级市、省级、中央
样本数量:6494条
数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)
数据来源:地方政府网站
数据说明:内含数字经济相关的60个词频明细、扩展词频
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频
➤利用正则表达式统计60个扩展词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、60个词频明细、文本长度
三、指标说明
一共70个指标,并额外统计扩展词频
四、数据概览
数据概览-中央级
数据概览-省级
数据概览-地级市
【下载→
方式一(推荐):主页 个人 简介
方式二:数据下载方式汇总-CSDN博客