使用python爬取全国天气数据并导入MySQL数据库表

本文介绍了如何使用Python分析中国天气网的网页结构,编写爬虫代码抓取各地区天气信息,并将数据存储到MySQL数据库中。在过程中,详细讲解了URL构造、数据解析、数据库创建、数据导入以及遇到的问题和解决方案。
摘要由CSDN通过智能技术生成

1、分析网页

首先开始观察要爬取的网页(此处为中国天气网天气预报):
这是华北地区的天气预报在这里插入图片描述网址为:http://www.weather.com.cn/textFC/hb.shtml

切换到东北地区后:在这里插入图片描述
可以发现url只有textFC/后面的字符改变了,hb代表华北,db代表东北,所以由此可以建立一个url列表,只要循环遍历此表,便可以获取各个地区的天气预报网页url(由于港澳台网页结构较为特殊,此处不做处理) 。在这里插入图片描述
接下来定义一个get_temperature函数来查找网页中需要的天气信息,构建一个headers参数,并提交request.get请求,接下来使用BeautifulSoup进行网页的解析。
在这里插入图片描述

在浏览器中按右键检查元素,观察网页结构,可以发现页面所有的城市信息及该城市的天气信息都在

的标签下,而每个conMidtab2的标签下的内容则为该地区各个省的天气信息: 在这里插入图片描述
该省不同城市的天气信息在conMidtab2的标签下的table的标签下的tbody里的tr标签内的td下,每个省的conMidtab2内的第3个tr标签开始才为真正的城市天气信息;每个含有天气信息的tr标签的第一个td标签里含有省份(直辖市)信息。
在这里插入图片描述

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值