使用python爬取全国天气数据并导入MySQL数据库表

最新推荐文章于 2024-08-14 17:39:55 发布

聂朝刚

最新推荐文章于 2024-08-14 17:39:55 发布

阅读量5.9k

点赞数 9

文章标签： python mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40945375/article/details/104966864

版权

本文介绍了如何使用Python分析中国天气网的网页结构，编写爬虫代码抓取各地区天气信息，并将数据存储到MySQL数据库中。在过程中，详细讲解了URL构造、数据解析、数据库创建、数据导入以及遇到的问题和解决方案。

摘要由CSDN通过智能技术生成

文章目录

1、分析网页
2、分析完毕，开始编写代码：
3、使用MySQL创建数据库跟表
4、导入数据
5、完整代码：
6、遇到的问题

1、分析网页

首先开始观察要爬取的网页（此处为中国天气网天气预报）：
这是华北地区的天气预报在这里插入图片描述网址为：http://www.weather.com.cn/textFC/hb.shtml

切换到东北地区后：在这里插入图片描述
可以发现url只有textFC/后面的字符改变了，hb代表华北，db代表东北，所以由此可以建立一个url列表，只要循环遍历此表，便可以获取各个地区的天气预报网页url（由于港澳台网页结构较为特殊，此处不做处理）。在这里插入图片描述
接下来定义一个get_temperature函数来查找网页中需要的天气信息，构建一个headers参数，并提交request.get请求，接下来使用BeautifulSoup进行网页的解析。

在浏览器中按右键检查元素，观察网页结构，可以发现页面所有的城市信息及该城市的天气信息都在

的标签下，而每个conMidtab2的标签下的内容则为该地区各个省的天气信息：在这里插入图片描述

在这里插入图片描述

该省不同城市的天气信息在conMidtab2的标签下的table的标签下的tbody里的tr标签内的td下，每个省的conMidtab2内的第3个tr标签开始才为真正的城市天气信息；每个含有天气信息的tr标签的第一个td标签里含有省份（直辖市）信息。
在这里插入图片描述

在这里插入图片描述

最低0.47元/天解锁文章

关注

9
点赞
踩
116

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。