1.开发环境:
python 3.5 + fiddler 4 (抓包工具)+ 火狐浏览器 + idea
2.分析要爬取的页面
2.1 首页 数据中心 点击 全国城市空气质量小时报 查看 fiddler4
表格中的内容就是要抓取的对象
分析fiddler 4 看出请求的方式 请求参数 以及 返回的响应对象
注意:一定要抓 返回带有 上述表格 的url (直接请求的url 不含该表格 可以通过浏览器F12查看开发者模式分析)如图:
</
1.开发环境:
python 3.5 + fiddler 4 (抓包工具)+ 火狐浏览器 + idea
2.分析要爬取的页面
2.1 首页 数据中心 点击 全国城市空气质量小时报 查看 fiddler4
表格中的内容就是要抓取的对象
分析fiddler 4 看出请求的方式 请求参数 以及 返回的响应对象
注意:一定要抓 返回带有 上述表格 的url (直接请求的url 不含该表格 可以通过浏览器F12查看开发者模式分析)如图:
</