所有的双色球开奖记录都在这里了

本文介绍了一位初学者如何用Python编写爬虫程序,抓取双色球的所有历史开奖记录。首先找到数据入口,接着爬取包含历史记录的URL,最后遍历这些URL并将每年的开奖数据存储到文件中。
摘要由CSDN通过智能技术生成

初学python,写了一个爬取历史双色球开奖记录的程序。希望大家互相交流学习

 1.找到数据的入口

百度一下双色球历史开奖记录,出来许多网站,找到可以查看历史记录的网站就行,我这里找到的是

http://kaijiang.500.com/ssq.shtml

里面看历史记录的入口是下拉框,只要爬取出下拉框里的地址,就知道历史的记录了。

2.爬取所有历史记录的地址

import requests
import LoadHistoryTask
#这个是代理,公司内网无法直接访问,正常是不需要的
proxy_dict = {
    "http": "http://****:****@proxy.****.com:8080/",
    "https": "http://****:****@proxy.****.com:8080/"
}
#获取页面内容
homePage = requests.get("http://kaijiang.500.com/ssq.shtml", proxies=proxy_dict)
homePage.encoding = "gb2312"
pageStr = homePage.text
#解析页面里下拉框选项里的地址,并放入list中
pageStr = pageStr[pageStr.find('<div class="iSelectList">'):]
historyArr = pageStr[len('<div class="iSelectList">'):pageStr.find('</div>')].s
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值