23.5.25:爬取天气数据

from bs4 import BeautifulSoup
import requests
import parsel
import pandas as pd
import numpy as np

weather = []   #创建一个列表用于在for循环中保存每次循环的数据
for year in range(2018,2024):  # 设置年份2018-2023年
    for month in range(1,13):  # 设置月份1-12月
        # get/post
        url = f'https://tianqi.2345.com/Pc/GetHistory?areaInfo[areaId]=60294&areaInfo[areaType]=2&date[year]={year}&date[month]={month}'
        response = requests.get(url=url)
        #print(response)
        #print(response.json()['data'])
        select = parsel.Selector(response.json()['data'])
        trs = select.css('table tr')
        for tr in trs[1:]:
            tds = tr.css('td::text').getall()  
            weather.append(tds)     # 将每次循环时产生的数据存在列表weather中
            #print(tds)
print(weather)

爬取结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值