今天来谈及行政区划代码的获取:
http://www.mca.gov.cn/article/sj/xzqh/2020/
在民政部官网,获取相应的数据,点击:2020年2月中华人民共和国县以上行政区划代码,进入网页:
http://www.mca.gov.cn/article/sj/xzqh/2020/2020/202003301019.html
鼠标右键,“检查” ,查看网页信息:
北京市,及其行政区划代码的节点为:td.xl7030721
市级下属区域,节点信息为:td.xl7130721
在获取节点信息后,需明确:
该网页信息不是表格型数据,因此不能使用 html_table() 函数
行政区划代码和单位名称,都属于同一节点信息,这给后续的数据处理,带来一定的麻烦
主要涉及后续的数据处理
为更加清晰明确地解决问题,本次除 rvest 包以外,不再使用其他的宏包,将采用 R 语言默认加载的包中的函数,解决数据处理难题。