使用Python对双色球号码进行爬取

本文介绍了如何使用Python爬虫从福彩官网抓取双色球历史号码。通过分析页面链接规律和利用正则表达式定位数据,实现了对多页数据的爬取。尽管后处理较为复杂,但最终成功获取并展示了所需信息。
摘要由CSDN通过智能技术生成

使用Python福彩官网对双色球进行爬取


很久之前写的一个小爬虫,代码其实有点冗杂,看官姥爷们如果有什么可以指点的地方,尽量拍,谢谢~

一点一点加油吧

目标是对所有双色球的号码进行爬取
在工作开始前我们需要先去网站蹲点
这个是页面:http://www.cwl.gov.cn/kjxx/ssq/hmhz/
页面分析工具:Firebug

首先进行页面的分析
点击一下第二页,链接变成了这样
http://www.cwl.gov.cn/kjxx/ssq/hmhz/index_1.shtml
再回到第一页,链接变成了这样
http://www.cwl.gov.cn/kjxx/ssq/hmhz/index.shtml
再去第三页,变成了这样

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值