Python网络爬虫:爬取天气预报 将数据保存到文本文件中

hello,大家好,我是wangzirui32,今天我们来学习如何爬取天气预报,并将数据保存到文本文件中,开始学习吧!

1. 解析网页

首先,来到https://www.tianqi.com/,搜索一个城市,如图:
网页
图中红框内的数据基本就是我们的爬取目标,这里我直接放出浏览器复制的XPath路径:

# 目前气温
/html/body/div[5]/div/div[1]/dl/dd[3]/p/b/text()
# 湿度
/html/body/div[5]/div/div[1]/dl/dd[4]/b[1]/text()
# 风向
/html/body/div[5]/
  • 2
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python爬虫是一种用于从网页上获数据的技术。实时天气数据可以通过以下步骤实现: 1. 导入所需的库:首先,需要导入Python的requests库和BeautifulSoup库。Requests库用于发送HTTP请求,而BeautifulSoup库用于解析HTML页面。 2. 发送HTTP请求:使用requests库发送GET请求到天气数据的网站。可以使用城市名称或者经纬度作为参数来获相应城市的天气数据。 3. 解析HTML页面:使用BeautifulSoup库解析返回的HTML页面。可以使用CSS选择器或XPath来定位所需的天气数据。 4. 提天气数据:根据HTML页面的结构,提所需的天气数据。可以使用BeautifulSoup提供的方法来提标签内的文本内容。 5. 处理和展示数据:对提到的天气数据进行处理和展示。可以将数据保存到文件或者通过其他方式展示给用户。 以下是一个简单的示例代码,用于实时天气数据: ```python import requests from bs4 import BeautifulSoup def get_weather(city): url = f'https://www.weather.com.cn/weather/{city}.shtml' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36' } response = requests.get(url, headers=headers) response.encoding = 'utf-8' soup = BeautifulSoup(response.text, 'html.parser') weather = soup.find(class_='tem').text.strip() return weather city = '101010100' # 北京的城市代码 weather_data = get_weather(city) print(f"北京的实时天气为:{weather_data}") ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值