Python爬虫——使用正则表达式爬取西安7天的天气预报,并使用prettytable模块输出

本文介绍了一个使用Python爬虫和正则表达式从天气网抓取西安未来7天天气预报的案例。通过解析网页源代码,匹配日期、星期、空气质量、天气、气温和风级等信息,了解如何应对网站的反爬虫措施。最终成功展示爬取结果。
摘要由CSDN通过智能技术生成

使用正则表达式爬取西安7天的天气预报

这个爬虫的案例就是对正则表达式的运用,通过这个案例,我们可以对正则表达式有更加深入的理解。

1. 信息来源:

天气网。  链接为:https://www.tianqi.com/xian/7

2. 解析需要爬取的信息:

进入主页,我们可以看到如上图所示的信息,我们需要爬取的就是上图中的所有内容。

我们在主页中点击右键——>查看网页源代码——>找到对应的信息——>如图所示

我们对上图所示的信息进行分析,可以发现:(匹配就得多试验,每个人的匹配方式可能不同,多尝试)

  • 日期可以通过正则表达式—— r'>(\d\d月\d\d日)<'  匹配到;
  • 星期可以通过正则表达式—— r'class="week">(.+)</dd>'  匹配到;
  • 空气质量可以通过正则表达式—— r'>(.{1,4})</b></dd>' 匹配到;
  • 天气可以通过正则表达式—— 
  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值