Python爬取双色球，妈妈再也不会担心我不会中奖了

最新推荐文章于 2024-07-05 09:53:33 发布

weixin_33752045

最新推荐文章于 2024-07-05 09:53:33 发布

阅读量1.6k

点赞数 6

文章标签： python 数据库爬虫

原文链接：https://juejin.im/post/5c8f9427e51d452de2588d7d

版权

本文通过Python爬虫获取500彩票网站上的双色球历史数据，建立数据库存储红球、篮球和日期信息。统计各数字出现频率，发现双色球开奖并无明显规律，旨在学习爬虫和数据可视化技巧。作者提醒，虽然靠双色球实现财富自由不易，但偶尔购买也能带来乐趣。

摘要由CSDN通过智能技术生成

一、概况

一般大家都能会有个财富自由、时间自由的梦想。除了我们勤奋努力外，有些人运气比较好，买了一注彩票，瞬间会走上人生巅峰。彩票确实让有些人实现了这个梦想，但是这个概率太低了，低到无法想象。所以我们还是努力奋斗，做一个追梦人吧！

我们今天就爬取有史以来所有的双色球数据，看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么？双色球顾名思义就是两种颜色的球，一个红色，一个蓝色。红球从1-33中取出6个，篮球从1-16取出1个，如果你买的跟开奖号码一样，恭喜你几百万到手。

二、分析网站

我们今天准备爬取的网站叫500彩票（www.500.com/）这个网站有很多彩票的开奖信息，我们找到全国开奖这个导航（kaijiang.500.com/）

在这我们可以查询任何的彩票开奖信息：

我们选择双色球，并打开浏览器调试：

可以看出来是一个ajax（ kaijiang.500.com/static/info… 请求，并且返回很多的xml信息。信息里面包括了有史以来所有双色球的开奖号码信息。数据有了，我们完全可以用正则表达式把我们想要的数据提取出来，然后保存到数据库。

三、逻辑实现

我们在本地先创建好数据库，我们要的信息只有三个：

红球
篮球
日期代码比较简单：

import requests
import re
import pymysql

# 请求地址
url = 'http://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=BLWXUIYA1546584359929'

# 数据库连接
connection = pymysql.connect(host='localhost',
                             user&