注:上图显示为2020年,实际更新至2022年
一、数据介绍
数据名称:中国县域统计年鉴无缺失填充版(2000-2022年)
数据范围:2725个区县
数据年份:2000-2022年
样本数量:2725县*23年=62675条
数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》
二、整理方法
第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标
共计83个指标,部分如下:
【下载→
方式一(推荐):主页个人 简介
经管数据库-CSDN博客
方式二:数据下载地址汇总-CSDN博客