python爬取体彩排列3历史数据并验证其纯随机性

摘要:本文目的为验证体彩排列3的纯随机性。从网站上爬取一千二百多条历史开奖数据。将三个数字依次作为百位十位个位,以这些数据看作时间序列,然后利用时间序列分析白噪声检验其纯随机性,结果从大方向看体彩排列3开奖号确实是纯随机的。
主要步骤:
一、编写爬虫爬取数据并处理储存。
二、绘制时序图、自相关图等。
三、进行白噪声检验。

第一步:爬取数据
代码如下:

import requests
import bs4
import pandas as pd
import matplotlib.pyplot as plt
from pandas.plotting import autocorrelation_plot
from statsmodels.sandbox.stats.diagnostic import acorr_ljungbox
url='http://datachart.500.com/pls/history/inc/history.php?limit=1284&start=20000&end=21284'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'}
r=requests.get(url=url,headers=headers)
# 改变格式,把文本版的数据赋值给另一个变量
r.encoding='gbk'
T_W=r.text
# 创建bs4对象
bs1=bs4.BeautifulSoup(T_W,'html.parser')
k=0
Z=[]
for j in bs1.find_all('td',class_='cfont2'):
    txt=j.text
    txt=txt.replace(" ","")
    k=k+1
    Z.append(int(txt))
Z=Z[::-1]
K=range(k)
PD_S=pd.DataFrame(Z,columns=['开奖'])
PD_S1=pd.DataFrame(K,columns=['序号'])
PD_S=PD_S1.join(PD_S)

第二步:绘制时序图、自相关图等。

# 绘制时序图
fig1= plt.figure(1)
plt.plot(range(len(Z)),Z, color='blue', linewidth=2)
plt.grid()
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.title('开奖号')
plt.xlabel("时间")
plt.ylabel("号码")
ax4= plt.gca()
plt.show()

# 绘制自相关图
fig2= plt.figure(2)
autocorrelation_plot(Z)
plt.title('开奖号码自相关图')
plt.show()
qljungbox, pval=acorr_ljungbox(Z,boxpierce=False)

第三步:进行白噪声检验

fig3= plt.figure(3)
plt.plot(range(len(qljungbox)),qljungbox, color='blue', linewidth=2)
plt.title('LB值')
plt.show()

fig4= plt.figure(4)
plt.plot(range(len(pval)),pval, color='blue', linewidth=2)
plt.title('P值')
plt.show()

qljungbox6, pval6=acorr_ljungbox(Z,lags=6,boxpierce=False)
print('延期为6时P值')
print(pval6[5])

qljungbox12, pval12=acorr_ljungbox(Z,lags=12,boxpierce=False)
print('延期为12时P值')
print(pval12[11])

qljungbox18, pval18=acorr_ljungbox(Z,lags=18,boxpierce=False)
print('延期为18时P值')
print(pval18[17])

qljungbox24, pval24=acorr_ljungbox(Z,lags=24,boxpierce=False)
print('延期为24时P值')
print(pval24[23])

在这里插入图片描述
从P值图上可以看出,P值显然大于0.05,故接受原假设(序列非纯随机)。
当然这只是很片面的得出的结论,也是从大方向看的结果,那么如果就短时间来说,彩票有无规律可循呢?

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小老虎会发光X

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值