Python爬取城市空气质量数据

wp_tao

于 2024-06-07 22:49:47 发布

阅读量1k

点赞数 1

分类专栏： Python全栈文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lyccomcn/article/details/139536697

版权

Python全栈专栏收录该内容

51 篇文章 4 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

Python爬取城市空气质量数据

一、思路分析
二、完整代码

一、思路分析

目标数据所在的网站是天气后报网站，网址为：www.tianqihoubao.com，需要采集武汉市近十年每天的空气质量数据。先看一下爬取后的数据情况：
在这里插入图片描述

1、寻找数据接口

在天气后报网站主页找到空气质量菜单项并点击，找到湖北武汉市并点击，下拉找到时间列表，点击一个月份时间（以2024年3月为例），进入到如下图所示页面：
在这里插入图片描述
打开浏览器开发者工具（按F12键或者在页面右键然后点击检查）进行抓包，按F5刷新页面，发现开发者工具Network选项卡下抓到了很多数据包，如图所示：

查看每个数据包中的Response，发现我们所需要的数据在http://www.tianqihoubao.com/aqi/wuhan-202403.html数据包中。

2、发送请求

第二步就是要模拟浏览器向服务器发送请

了解本专栏

超级会员免费看

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Python爬取城市空气质量数据

首先找到所有的tr标签，每一个tr标签下对应一天的空气质量情况，然后遍历每一个tr标签，tr标签下的每一个td标签对应的依次是日期、空气质量等级、AQI指数等数据，将数据依次提取出来，使用get_text()方法获取每一个td标签下的文本数据。这是一个get请求，在发送请求时需要携带cookie、User-Agent等参数，当然，后端服务器可能也会检测其它参数，具体需要哪些参数需要一一尝试，或者直接携带所有参数。数据的持久化保存使用的是python自带的csv库，保存数据至csv文件。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。