2000-2020年中国村(居)委会及其以上区划代码和数据

2000-2020年中国村(居)委会及其以上区划代码和数据

背景

要求分析2000年到2020年,中国城乡区划的空间变化,查阅到开源数据有国家统计局统计用区划和城乡划分代码数据。

方法

步骤一:配置环境

python环境配置

网上教程太多,安装anaconda就好,只需要把路径添加到系统环境变量中

redis数据库的配置

由于需要爬取数据量比较大,我是用的是scrapy-redis框架,分布式爬取,所以用到redis数据库,具体方法请参考我的知乎文章linux 安装配置redis - 知乎 (zhihu.com)以及这个win10 部署scrapy-redis - 知乎 (zhihu.com)

配置一个虚拟环境(选做)

这部分不是必须的,但是我个人习惯做爬虫类,我就用一个爬虫类的虚拟环境进行

步骤二:编写核心代码

编写scrapy爬虫代码,使用这个框架,你不用再浪费心思去思考异步等问题,只需要专心写你提取的规则就好。

步骤三

启动项目,静静等待数据采集

步骤四:从存储数据中提取数据

最终爬取完之后,数据都存在redis数据库中,可以使用redis-dump工具,进行数据的迁移。

结果

代码已开源,请参考https://gitee.com/bahapku/china_area_code

数据已经整理好,有需要请邮件联系bahapku@foxmail.com告知具体诉求,拒绝商业化利用!!!

声明

拒绝恶意爬取,拒绝商业化利用,非本人允许,禁止转载。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bahapku007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值