python爬虫之爬取天气预报

最新推荐文章于 2024-07-24 14:36:42 发布

m0_60701922

最新推荐文章于 2024-07-24 14:36:42 发布

阅读量1.4k

点赞数 2

文章标签： python 爬虫

本文链接：https://blog.csdn.net/m0_60701922/article/details/120123428

版权

本文介绍了两种使用Python进行天气预报爬取的方法，详细阐述了如何利用Python的网络请求库和解析库来抓取并处理天气信息。

摘要由CSDN通过智能技术生成

方法一

"""
需求：
1.爬取全国所有的城市名称以及对应的气温
2.保存所有的城市名称以及对应的气温到为csv文件

目标url:
1.华北地区：http://www.weather.com.cn/textFC/hb.shtml
2.东北地区：http://www.weather.com.cn/textFC/db.shtml
3.华东地区：http://www.weather.com.cn/textFC/hd.shtml
4.华中地区：http://www.weather.com.cn/textFC/hz.shtml
5.华南地区：http://www.weather.com.cn/textFC/hn.shtml
6.西北地区：http://www.weather.com.cn/textFC/xb.shtml
7.西南地区：http://www.weather.com.cn/textFC/xn.shtml
8.港澳台地区：http://www.weather.com.cn/textFC/gat.shtml
规律： 'http://www.weather.com.cn/textFC/' + dq_name + '.shtml' 其中，dq_name = [hb,db,hd,hz,hn,xb,xn,gat]
"""

# #2. 获取网页源代码
import requests
def get_source(url):
    response=requests.get(url)
    response.encoding='utf-8'
    return response.text
# 3.分析天气爬取规律
from bs4 import BeautifulSoup
def get_info(source):
    # 解决网页乱码，添加'html5lib'，而不是lxml
    soup = BeautifulSoup(source, 'html5lib')  # pip install html5lib
    # 1.进入整体表格
    conMidtab = soup.find('div', class_='conMidtab')
    # 2.进入子表格
    tables = conMidtab.find_all('table')
    # 3.进入每个子表格收集天气信息
    info = []
    for table in tables:
        # (1)过滤前两个（城市和时间）
        trs = table.find_all('tr')[2:]  # tr存储了每个城市的天气信息
        # enumerate 返回2个值第一个是下标 第二个下标所对应的元素
        # (2)进入每个城市（每一行）ÿ

最低0.47元/天解锁文章

m0_60701922

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
python爬虫之爬取天气预报

方法一"""需求：1.爬取全国所有的城市名称以及对应的气温2.保存所有的城市名称以及对应的气温到为csv文件目标url:1.华北地区：http://www.weather.com.cn/textFC/hb.shtml2.东北地区：http://www.weather.com.cn/textFC/db.shtml3.华东地区：http://www.weather.com.cn/textFC/hd.shtml4.华中地区：http://www.weather.com.cn/textFC/hz
复制链接

扫一扫