1、规则介绍
红球一共6组,每组从1-33中抽取一个,六个互相不重复。然后蓝球是从1-16中抽取一个数字,这整个组成的双色球。例如本期中奖号码:
根据排列组合公式,所有的号码组合总数为 33×32×31×30×29×28×16÷6÷5÷4÷3÷2 = 17721088
一等奖(6+1)中奖概率为:红球33选6乘以蓝球16选1=1/17721088=0.0000056%;
二等奖(6+0)中奖概率为:红球33选6乘以蓝球16选0=15/17721088=0.0000846%;
三等奖(5+1)中奖概率为:红球33选5乘以蓝球16选1=162/17721088=0.000914%;
……
由此可见,想要买中全部号码的概率为千万分之一!!那么,通过简单的数据分析之后,咱们看看能把概率提高到多少。
2、分析步骤
- 创建两张表,分别存入历史中奖数据和所有号码组合数据
- 通过不同维度对历史数据进行统计,如连号情况、奇数个数等
- 根据统计结果,把概率极低的指标在所有号码组合中打上标记
- 从剩余未打标记的数据中机选号码,并计算概率
3、历史中奖数据分析结果
本次分析采用的历史数据范围为2003年2月到2020年8月,分析维度为连号情况、号码加和、差值、奇数个数和平均值。其中打上底色内容为概率极低部分,具体内容如下:
4、根据分析结果过滤概率极低的号码组合
根据上述指标,在17721088条记录中进行打标记,最终结果分为三类:
不属于上述指标的2230875条;
属于上述指标中占比极低的9873237条;
属于上述指标中占较高的5616976。
其中第三类为中奖概率较高的号码,可作为机选号码的数据库。虽然概率仅仅降为百万级别,但是还有很多指标可以扩展。比如均匀分布情况,与上期号码重复情况等等。
5、补充说明
历史中奖数据下载地址:添加链接描述
相关代码下载地址(建表语句、生成所有号码组合、实现机选号码及统计分析代码):添加链接描述
(采用的是oracle数据库)
PS:无论概率提高到多少,实际中奖概率依然接近于0。大家还是不要抱有万一的侥幸哈~