一、概况
一般大家都能会有个财富自由、时间自由的梦想。除了我们勤奋努力外,有些人运气比较好,买了一注彩票,瞬间会走上人生巅峰。彩票确实让有些人实现了这个梦想,但是这个概率太低了,低到无法想象。所以我们还是努力奋斗,做一个追梦人吧!
我们今天就爬取有史以来所有的双色球数据,看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么?双色球顾名思义就是两种颜色的球,一个红色,一个蓝色。红球从1-33中取出6个,篮球从1-16取出1个,如果你买的跟开奖号码一样,恭喜你几百万到手。
二、分析网站
我们今天准备爬取的网站叫500彩票(www.500.com/) 这个网站有很多彩票的开奖信息,我们找到全国开奖这个导航(kaijiang.500.com/)
在这我们可以查询任何的彩票开奖信息: 我们选择双色球,并打开浏览器调试: 可以看出来是一个ajax( kaijiang.500.com/static/info… 请求,并且返回很多的xml信息。信息里面包括了有史以来所有双色球的开奖号码信息。数据有了,我们完全可以用正则表达式把我们想要的数据提取出来,然后保存到数据库。三、逻辑实现
我们在本地先创建好数据库,我们要的信息只有三个:
- 红球
- 篮球
- 日期 代码比较简单:
import requests
import re
import pymysql
# 请求地址
url = 'http://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=BLWXUIYA1546584359929'
# 数据库连接
connection = pymysql.connect(host='localhost',
user&