纪念一下搞出来的一个东西,不过都是参考网上的,只懂一些表面的,不会深层的东西,欢迎批评指正
1.爬取2019年7月到2020年6月阜阳地区的天气:
#爬取气温代码
months = []
for year in (2019,):
for month in range(6,12):
months.append("%d%02d"%(year, month+1))
for year in (2020,):
for month in range(0,6):
months.append("%d%02d"%(year, month+1))
todo_urls = [
f"http://tianqi.2345.com/t/wea_history/js/{month}/58203_{month}.js"
for month in months
]
import requests
datas = []
for url in todo_urls:
r = requests.get(url)
if r.status_code!=200:
raise Exception()
# 去除javascript前后的字符串,得到一个js格式的JSON
data = r.text.lstrip("var weather_str=").rstrip(";")
datas.append(data)
import demjson
demjson.decode(datas[0])
tqInfos = demjson.decode(datas[0])["tqInfo"]
# 解析所有月份的数据
all_datas = []
for data in datas:
tqInfos = demjson.decode(data)["tqInfo"