文章仅写个人理解,错误之处望请指出,谢谢 ~ (≧▽≦)/ ~
使用python获取国家省市区资料
写在前言
后端主要侧重的是思维思路,语言只是一种表达。本篇文章试图侧重于思路讲解。如果有什么描述模糊之处,望请留言提醒,一起共勉。
我主要使用php,python只是现学现用。主要想了解下python爬虫有多方便,事实证明,真香~~
看正文前不妨先问问自己,爬取数据的本质是什么?爬取数据,主要需要做什么?
首先我们该去哪里获取数据?
这一步主要找到资源所在的网站即可。
去国家统计局搜索最终找到2020年最新数据所在,链接如下:
http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html
怎么获取获取?
爬取省级信息。
浏览器打开调试,随便定位一个省,查看html代码。从右边可以看出html标签属性,所有的省级信息都在具有class为provincetr的tr标签下,tr下的一个td标签即为一个省的信息。