各省、地级市政府工作报告文本环境相关词频数据(1954-2024年)

本次数据为地级市、省级、中央三级环境规制15个词频、扩展词频,分别统计中央、省级、地级市三个层面的环境规制词频明细数据,数据更新至2024年

一、数据介绍

数据名称:环境规制15个相关词频统计

数据范围:地级市、省级、中央

数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)

数据来源:地方政府网站

数据说明:内含环境规制相关的15个词频明细、扩展词频

二、整理说明

➤从地方政府网爬取工作报告原始文件

➤将报告文本整理为面板数据

➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频

➤利用正则表达式统计15个扩展词频

➤保留中英文、数字,统计全文文本总长度

➤保存文本词频总数、15个词频明细、文本长度

三、指标说明

一共24个指标,并额外统计扩展词频

四、数据概览

数据概览-中央级

数据概览-省级

数据概览-地级市

【下载→

方式一(推荐):主页个人 简介
经管数据库-CSDN博客

方式二:数据下载地址汇总-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值