使用Python去爬取中国天气网的近7天天气情况

import requests
from bs4 import BeautifulSoup


address = 'http://www.weather.com.cn/weather/101{}.shtml'


for i in range(1,24):
    z = ''
    if i<5:
        z = '0'+str(i)+'0100'
    if i>4 and i<10:
        z = '0'+str(i)+'0101'
    if i>9:
        z = str(i)+'0101'
    address1 =address.format(z)
    #print(address1)
    w = requests.get(''+address1+'')
    
    #转换编码解决中文问题
    t1 = w.text.encode('ISO-8859-1').decode('utf-8')
    ht1 = BeautifulSoup(t1,'html5lib')

    body1 = ht1.body  # 获取body部分
    #  print(body1)
    data = body1.find('div', {'id': '7d'})  # 找到id为7d的div
    ul = data.find('ul')  # 获取ul部分
    li = ul.find_all('li')  # 获取所有的li
    
    s = body1.find('div',{'class':'crumbs'})  #找到class为crumbs的div
    a = s.find_all('a')  # 获取a标签
    #print(s)
    if len(a) == 1:
        print(a[0].text)
    else:
        print(a[0].text,'-',a[1].text,end='\n')
    #print(li)
    list = []
    
    for day in li:   # 对每个li标签中的内容进行遍历
    # temp代存每日的数据
        temp = []
        
    #  添加日期
        data = day.find('h1').string   # 找到日期
        temp.append(data)  # 添加到temp中
        inf = day.find_all('p')  # 找到li中的所有p标签
    #  添加天气状况    
        temp.append(inf[0].string)  # 第一个p标签中的内容(天气状况)加到temp中
    #  添加温度
        tem = day.find('i').string   # 找到温度
        temp.append(tem)  # 添加到temp中
        inf = day.find_all('i')  # 找到li中的所有p标签
        
        list.append(temp)  # 将temp 加到list中
    for j in range(len(list)):  
        print(list[j],end='\n')

输出结果:

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值