- 博客(1)
- 收藏
- 关注
原创 利用python爬虫获取全国五级地址
1、抓取省级地址2019年数据区划和城乡划分的最新数据为2019年的,点击上方链接即可查看2019年相关数据。分析网页可以看出,各省的链接和文本信息都存放在如下的标签中。<a href="11.html">北京市<br></a>由于国家统计局的网址结构比较简单,因此可以直接使用正则表达式提取pattern = re.compile("<a href='(.*?)'>(.*?)<")具体地,抓取31省数据代码如下所示。由于后面抓取五级数据
2020-10-09 16:32:23 4371 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人