python爬取空气质量指标_python爬虫之静态网页——全国空气质量指数(AQI)爬取

最新推荐文章于 2022-12-01 10:34:30 发布

weixin_39911066

最新推荐文章于 2022-12-01 10:34:30 发布

阅读量1.3k

点赞数

文章标签： python爬取空气质量指标

本文链接：https://blog.csdn.net/weixin_39911066/article/details/111426211

版权

本文介绍了如何使用Python的requests和BeautifulSoup库爬取全国空气质量指数(AQI)数据。首先从主页面获取城市链接，然后遍历每个城市的链接，抓取并储存城市名及其对应的AQI值。需要注意处理一些异常链接，确保爬取的稳定性。

摘要由CSDN通过智能技术生成

首先爬取地址：http://www.air-level.com/

利用的python库，最近最流行的requests，BeautifulSoup。

requests：用于下载html

BeautifulSoup：用于解析

下面开始分析：要获取所有城市的aqi，就要进入每个城市的单独链接，而这些链接可以从主页中获取

打开主网页，查看源代码，可以看到，所有的城市链接都在id=‘citylist’里面

把所有链接爬下来存在一个列表里面，然后依次爬取每个城市的单个链接，附代码：

def get_all_city(): # 爬取城市链接

url = "http://www.air-level.com"

try:

kv = {'user-agent': 'Mozilla/5.0'} # 伪装成浏览器，headers

r = requests.get(url, headers=kv)

r.raise_for_status()

r.encoding = r.apparent_encoding

except:

print("爬取城市链接失败")

demo = r.text

soup = BeautifulSoup(demo, "html.parser")

time &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39911066

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬取全国空气质量信息，空气质量最好的居然是它！

爬遍所有网站

05-19

2731

主要模块 requests模块。使用requests模块来获取http响应 gevent模块。使用gevent开启多个协程，加快爬取速度 re模块或beautifulsoup模块。正则表达式解析与beautifulsoup解析两种解析方式我都会写出来。 csv模块。用于将数据导出至csv文件内分析过程 1.要爬取的页面的URL地址为：http://www.tianqihoubao.com/aqi/。首先访问该页面（如下图）获取所有城市a标签的href属性，知道了各个城市的api，就可以接着爬..

python爬取某城市各监测站点历史空气质量数据

weixin_43982422的博客

05-08

7876

python爬取真气网某地各监测点气候数据由

参与评论您还未登录，请先登录后发表或查看评论

python爬虫之静态网页——全国空气质量指数(AQI)爬取

热门推荐

HGS的博客

06-11

1万+

首先爬取地址：http://www.air-level.com/ 利用的python库，最近最流行的requests，BeautifulSoup。 requests：用于下载html BeautifulSoup：用于解析下面开始分析：要获取所有城市的aqi，就要进入每个城市的单独链接，而这些链接可以从主页中获取打开主网页，查看源代码，可以看到，所有的城市链接都在id=‘cityl...

Python爬虫 — 武汉市近年来空气质量数据

12-20

本次是通过Python爬虫来获取武汉市近年来空气质量数据我使用的网站是：http://www.tianqihoubao.com 1. 开始首先导入所需要的库 import time, requests import pandas as pd from lxml import etree 接下来就是爬虫的代码了 url = 'http://www.tianqihoubao.com/aqi/wuhan.html' #找到关于武汉的页面 headers = { 'user-agent': "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_1)

python获取空气质量指数

04-07

利用python 爬虫工具，可以获取空气质量指数ppt和空气质量指数，

爬取全国空气质量监测网代码.py

05-28

python爬虫天气数据_Python爬取真气网天气数据

weixin_39970994的博客

12-04

1961

使用工具：pycharm，Chrome driver使用库：selenium前言：我们无时无刻不在呼吸着周围的空气，可身边的空气质量怎样呢？嗯~~~大多数人会沉思一会儿，最后还是会说：不知道。我们平时看到的AQI只是环境综合指数，有时并不能完全反应环境质量，看来我们需要的是原始数据。有了原始数据，我们不但能分析现在的环境状况，甚至还能对未来的环境状况做出自己的预测，听起来是不是很XX呢。古同还没找...

python产品质量分析报告范文_Python & Jinja2 徒手生成数据分析报告

weixin_39536427的博客

02-09

422

一、背景基于最近自动化实现数据分析报告，支持自动化实现不同分析主题的数据分析项目。例如：空气质量AQI分析报告，股票行情波动分析报表。数据数据分析报告构成：图表解释(pyechart只输出图表)、分析结论(文字描述)、统计分析(差别是否有统计学意义)。二、目的1. 设计统一报告模板：文字+图表2. 自动化输出：python脚本一键式输出3. 图表区可交互：基于pyecharts库的html，...

python爬取空气质量_python爬取全国空气质量信息

weixin_39954569的博客

12-17

1690

主要模块requests模块。使用requests模块来获取http响应gevent模块。使用gevent开启多个协程，加快爬取速度re模块或beautifulsoup模块。正则表达式解析与beautifulsoup解析两种解析方式我都会写出来。csv模块。用于将数据导出至csv文件内分析过程1.要爬取的页面的URL地址为：http://www.tianqihoubao.com/aqi/。首先访问...

空气质量爬虫以及可视化_空气质量爬虫_全国空气质量爬虫以及可视化_

10-04

每小时爬取空气知音网站的全国空气质量情况并可视化

利用python爬取空气质量数据，并用Matplotlib模块画出分析图

weixin_45079473的博客

12-01

1840

用requests爬虫，Matplotlib画图

我在CSDN的第一篇博客

qq_34955491的博客

09-24

981

大数据技术学习欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markd...

python爬取空气质量_Python爬取中国天气网天气

weixin_42365176的博客

02-21

341

importsysimportreimportrequestsimportwebbrowserfrom PIL importImagefrom requests.exceptions importRequestExceptionimportcsvdata={}with open("data.csv",‘r‘) as f:rawinfos=list(csv.reader(f))for i inraw...

爬取全国空气空气质量

weixin_44454180的博客

01-23

1699

今天天气不大好，我就是看看天气，我就发现这个网站数据不错，今天就给他全干下来！！！！！！链接：http://www.pm25.com/ 我们先打开网站，查看下数据是否在相应的源码，利用network进行抓包，结果如下：数据就在相应源码中，我们就将这个页面响应代码，用lxml解析，将源代码转化为etree树，分别使用xpath提取链接对每一个链接进行请求，然后再对详情页响应解析，例如：北京天气详情页http://www.pm25.com/beijing.html我们大致思路就是这样，最后把数据保存为csv

爬取空气质量1

weixin_30898109的博客

05-26

188

import urllib.request import requests import csv import re from lxml import etree url='http://www.air-level.com' response=urllib.request.urlopen(url+'/').read().decode() hrefs=re.findall(...

python爬空气污染实时数据_一键爬取空气质量相关指数

weixin_39609650的博客

12-01

1885

刚刚入门python，想上手一些比较简单的爬虫项目。今天我们来爬一爬一个空气质量指数的网站来获取全国城市的空气质量指数。记得跟着我的思路来哟！前期准备工作首先一个舒服的pythonIDLE肯定是必须的了，小编使用的是pycharm，安装的是anaconda，不懂安装的自行去简书查查哟，这里不再赘述。然后确定的我们要爬取的网站，这个网站是http://pm25.in/，界面是这样的：image.pn...

爬取 空气质量数据

一位浪漫的极客

08-28

1632

某时刻全国所有城市AQ 使用urllib进行http请求，bs解析为tree结构 import urllib.request from bs4 import BeautifulSoup url='http://www.pm25.in/rank'#空气rank html=urllib.request.urlopen(url) data=html.read()#执行完html就变成空了，所以我在...

Python小程序(8)--空气质量指数计算+爬虫获取空气质量指数+数据分析

学习随笔

05-28

8948

版本1.0 ''' 功能：AQI计算版本：1.0 ''' def cal_linear(iaqi_lo,iaqi_hi,bp_lo,bp_hi,cp): ''' 范围缩放 ''' iaqi = (iaqi_hi-iaqi_hi)*(cp-bp_lo)/(bp_hi-bp_lo) + iaqi_lo return iaqi def ca...

如何用python爬取空气质量_python爬取全国空气质量信息具体代码以及实现方法