通过爬取民政部官网的行政区域代码,为今后爬取县级地图数据,县级数据合并成市的工作做准备。
1 需要的包
rm(list = ls()); gc() # 清空内存library(tibble)library(dplyr)library(purrr)library(magrittr)library(rvest)library(stringr)library(tidyr)## used (Mb) gc trigger (Mb) max used (Mb)## Ncells 524864 28.1 1188784 63.5 621654 33.2## Vcells 1005522 7.7 8388608 64.0 1600121 12.3
2 爬行政区域代码
首先打开 民政部官网,如下所所示。点击图中的“行政区域代码”,从而会有最新的行政区域代码公示。
2019年12月县以上行政区域代码如下所示
然后使用爬虫爬取以上数据。需要注意的是,该表缺乏台湾、香港、澳门3个地区的区县信息。使用 SelectorGadget插件, 很容易发现“市级行政区域”的class
是.x17214735
;而“县级行政区域”的class
是.x17314735
。
3 访问网页
url_allCode html_allCod