前两天的编写如何安装第三方库,以及无法import已经安装好的第三方库的解决方法,消耗了我的大量的精力,今天开始继续开始我的Python学习之旅,还有最后的4节课了。
这节课主要讲,如何获取全部的城市AQI?首先要获取全部城市的列表,然后遍历城市列表,从而获取的所有城市的AQI。
"""
作者:lanxingbudui
日期:2020-03-04
功能:AQI计算
版本:7.0
"""
import requests
from bs4 import BeautifulSoup
def get_city_aqi(city_pinyin):
"""
获取一个城市的所有AQI指标
"""
url = 'http://pm25.in/' + city_pinyin
r = requests.get(url, timeout=30) # 链接网页请求
print(r.status_code) # 打印返回结果,200成功 400失败
soup = BeautifulSoup(r.text, 'lxml') # 创建BeautifulSoup对象
div_list = soup.find_all('div', {'class': 'span1'}) # 查找所有spen1属性的节点
# 或者 = soup.find_all('div', class_ = 'spanl') # 不推荐这样写,因为class是关键字,有时容易忘记下划线。
city_aqi = []
for i in range(8):
div_content = div_list[i]
caption = div_content.find('div', {'class': 'caption'}).text.strip()
value = div_content.find('div', {'class': 'value'}).text.strip()
# .text是获取属性值,并且.strip()移除上步骤中 text 字符串头尾的空格或换行符
city_aqi.append((caption, value))
return city_aqi
def get_all_cities():
"""
获取所有城市
"""
url = 'http://pm25.in/'
city_list = []
r = requests.get(url, timeout=30) # 链接网页请求
soup = BeautifulSoup(r.text, 'lxml') # 创建BeautifulSoup对象
city_div = soup.find_all('div', {'class': 'bottom'})[1]
# <a href="/abazhou">阿坝州</a> 获取类似这一段的内容,取所有的城市
city_link_list = city_div.find_all('a')
for city_link in city_link_list:
city_name = city_link.text # 获取value值---阿坝州
city_pinyin = city_link['href'][1:] # 获取hrdf的属性值 --/abazhou 并消去/
city_list.append((city_name, city_pinyin))
return city_list
def main():
"""
主函数
"""
city_list = get_all_cities()
for city in city_list:
city_name = city[0]
city_pinyin = city[1]
city_aqi = get_city_aqi(city_pinyin)
print(city_name, city_aqi)
if __name__ == '__main__':
main()
结果图: