国家省、市、县、镇/街道地址

近期在做地址识别的项目,因此从统计局官网上爬取了全国地址信息,链接:

2021年统计用区划代码和城乡划分代码

是根据2021的统计用区划编码来获取地址信息的,首页截图如下:

设置爬虫,逐个逐级爬取,最终形成省、市、县3级地址信息,省、市、县、街道/镇4级地址信息,省、市、县、街道/镇、村/居委会5级地址信息。所有地址信息只保留地址,而不保留区划代码,文件格式txt,无空格、制表符,一行代表一个地址信息。

3级地址爬取后如下:

北京市市辖区东城区
北京市市辖区西城区
北京市市辖区朝阳区
北京市市辖区丰台区
北京市市辖区石景山区
北京市市辖区海淀区
北京市市辖区门头沟区
北京市市辖区房山区
北京市市辖区通州区
北京市市辖区顺义区

4级地址信息爬取后结果如下:

北京市市辖区东城区东华门街道
北京市市辖区东城区景山街道
北京市市辖区东城区交道口街道
北京市市辖区东城区安定门街道
北京市市辖区东城区北新桥街道
北京市市辖区东城区东四街道
北京市市辖区东城区朝阳门街道
北京市市辖区东城区建国门街道
北京市市辖区东城区东直门街道
北京市市辖区东城区和平里街道
北京市市辖区东城区前门街道

5级地址信息爬取后结果如下:

北京市市辖区东城区东华门街道多福巷社区居委会
北京市市辖区东城区东华门街道银闸社区居委会
北京市市辖区东城区东华门街道东厂社区居委会
北京市市辖区东城区东华门街道智德社区居委会
北京市市辖区东城区东华门街道南池子社区居委会
北京市市辖区东城区东华门街道灯市口社区居委会
北京市市辖区东城区东华门街道正义路社区居委会
北京市市辖区东城区东华门街道台基厂社区居委会
北京市市辖区东城区东华门街道韶九社区居委会
北京市市辖区东城区东华门街道王府井社区居委会
北京市市辖区东城区交道口街道交东社区居委会
北京市市辖区东城区交道口街道福祥社区居委会
北京市市辖区东城区交道口街道大兴社区居委会
北京市市辖区东城区交道口街道府学社区居委会

地址信息下载链接:

全国3级、4级、5级地址,3级到区县,4级到乡镇,5级到村居委会,2021年新版,包含全部地址-其它文档类资源-CSDN下载

在处理地址时,北京、天津、上海、重庆等直辖市,在1级地址下面增加了“市辖区”、“县”两个级别,这样的话其地址结构也是5级,同其它省份一样。同时还发现有几个地市的结构和其它省份地市不一样,它只有4级地址:省、市、镇/街道、村,所以此时的3级地址会包含到镇。这几个地市是:海南省澶州市、广东省东莞市、广东省中山市。同时,在提取到街道/镇这一级地址时,其它地市属于第4级,而上述三个城市属于第3级。这些地点请注意

 如想要其它格式的地址,请联系

参考资料:

1 2021年统计用区划代码和城乡划分代码

国家统计局>>统计用区划和城乡划分代码

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值