注:后文不用看了,众所周知,现在的彩票出的球都是反重力静电粘粘结果有效球,所以彩票全都是假的(确信)
双色球的数学期望
绪论
玩家从33个红球中选择6个,从16个蓝球中选择1个,记作“6+1”。官方随机生成一个“6+1”的标准答案,按照玩家球与官方球的匹配程度判定奖励等级。三~六等奖的奖金为常量,而一二等奖的奖金是一个浮动的变量,只能从这个网页爬取。在爬取之前,可以设它们分别为a元/注和b元/注。
推导过程
将所有可能性和对应的奖励等级、奖金和概率列在一张表中:
情形 | 押中0个蓝球 | 押中1个蓝球 |
---|---|---|
押中0个红球 | 未中奖,0元/注, 15 C 27 6 16 C 33 6 \frac{15C_{27}^6}{16C_{33}^6} 16C33615C276 | 六等奖,+5元/注, C 27 6 16 C 33 6 \frac{C_{27}^6}{16C_{33}^6} 16C336C276 |
押中1个红球 | 未中奖,0元/注, 15 C 6 1 C 27 5 16 C 33 6 \frac{15C_6^1C_{27}^5}{16C_{33}^6} 16C33615C61C275 | 六等奖,+5元/注, C 6 1 C 27 5 16 C 33 6 \frac{C_6^1C_{27}^5}{16C_{33}^6} 16C336C61C275 |
押中2个红球 | 未中奖,0元/注, 15 C 6 2 C 27 4 16 C 33 6 \frac{15C_6^2C_{27}^4}{16C_{33}^6} 16C33615C62C274 | 六等奖,+5元/注, C 6 2 C 27 4 16 C 33 6 \frac{C_6^2C_{27}^4}{16C_{33}^6} 16C336C62C274 |
押中3个红球 | 未中奖,0元/注, 15 C 6 3 C 27 3 16 C 33 6 \frac{15C_6^3C_{27}^3}{16C_{33}^6} 16C33615C63C273 | 五等奖,+10元/注, C 6 3 C 27 3 16 C 33 6 \frac{C_6^3C_{27}^3}{16C_{33}^6} 16C336C63C273 |
押中4个红球 | 五等奖,+10元/注, 15 C 6 4 C 27 2 16 C 33 6 \frac{15C_6^4C_{27}^2}{16C_{33}^6} 16C33615C64C272 | 四等奖,+200元/注, C 6 4 C 27 2 16 C 33 6 \frac{C_6^4C_{27}^2}{16C_{33}^6} 16C336C64C272 |
押中5个红球 | 四等奖,+200元/注, 15 C 6 5 C 27 1 16 C 33 6 \frac{15C_6^5C_{27}^1}{16C_{33}^6} 16C33615C65C271 | 三等奖,+3000元/注, C 6 5 C 27 1 16 C 33 6 \frac{C_6^5C_{27}^1}{16C_{33}^6} 16C336C65C271 |
押中6个红球 | 二等奖,+b元/注, 15 16 C 33 6 \frac{15}{16C_{33}^6} 16C33615 | 一等奖,+a元/注, 1 16 C 33 6 \frac1{16C_{33}^6} 16C3361 |
根据上表,将上表中相同奖项在不同组合下的奖金-概率的乘积求和,可求出各奖项的数学期望:
- 成本为 − 2 -2 −2元/注。
- 六等奖为“0+1”,在列出表后可知,六等奖的实现条件实际上为(0+1)||(1+1)||(2+1)。
因此,其概率为 C 27 6 + C 6 1 C 27 5 + C 6 2 C 27 4 16 C 33 6 ≈ 0.0589 \frac{C_{27}^6+C_6^1C_{27}^5+C_6^2C_{27}^4}{16C_{33}^6}≈0.0589 16C336C276+C61C275+C62C274≈0.0589,奖励为 + 5 +5 +5元/注,故六等奖的期望约为 + 0.2945 +0.2945 +0.2945元/注。 - 五等奖为“(4+0)||(3+1)”,其概率为
15
C
6
4
C
27
2
+
C
6
3
C
27
3
16
C
33
6
≈
0.0078
\frac{15C_6^4C_{27}^2+C_6^3C_{27}^3}{16C_{33}^6}≈0.0078
16C33615C64C272+C63C273≈0.0078,奖励为
+
10
+10
+10元/注,故五等奖的期望约为
+
0.0776
+0.0776
+0.0776元/注。
五等奖的每注期望居然比四等奖还少一分钱,好坑啊。 - 四等奖为“(5+0)||(4+1)”,其概率为 15 C 6 5 C 27 1 + C 6 4 C 27 2 16 C 33 6 ≈ 0.0004 \frac{15C_6^5C_{27}^1+C_6^4C_{27}^2}{16C_{33}^6}≈0.0004 16C33615C65C271+C64C272≈0.0004,奖励为 + 200 +200 +200元/注,故四等奖的期望约为 + 0.0868 +0.0868 +0.0868元/注。
- 三等奖为“(5+1)”,其概率为 C 6 5 C 27 1 16 C 33 6 0.0001 \frac{C_6^5C_{27}^1}{16C_{33}^6}0.0001 16C336C65C2710.0001,奖励为 + 3000 +3000 +3000元/注,故三等奖的期望约为 + 0.4114 +0.4114 +0.4114元/注,有点意思。
- 二等奖为“(6+0)”,其概率为 15 16 C 33 6 ≈ 8.4645 × 1 0 − 7 \frac{15}{16C_{33}^6}≈8.4645×10^{-7} 16C33615≈8.4645×10−7,奖励为 b b b元/注,故二等奖的期望约为 + 8.4645 × 1 0 − 7 ⋅ b +8.4645×10^{-7}·b +8.4645×10−7⋅b元/注。
- 一等奖为“(6+1)”,其概率为
1
16
C
33
6
≈
5.643
×
1
0
−
8
\frac1{16C_{33}^6}≈5.643×10^{-8}
16C3361≈5.643×10−8,奖励为
a
a
a元/注,故二等奖的期望约为
+
5.643
×
1
0
−
8
⋅
a
+5.643×10^{-8}·a
+5.643×10−8⋅a元/注。
将上述所有期望相加,可得买双色球赚钱(即总的期望>0)的条件为:
− 2 + 0.2945 + 0.0776 + 0.0868 + 0.4114 + 8.4645 × 1 0 − 7 ⋅ b + 5.643 × 1 0 − 8 ⋅ a > 0 -2+0.2945+0.0776+0.0868+0.4114+8.4645×10^{-7}·b+5.643×10^{-8}·a>0 −2+0.2945+0.0776+0.0868+0.4114+8.4645×10−7⋅b+5.643×10−8⋅a>0
将2移到右边,让等式两边各乘 16 C 33 6 16C_{33}^6 16C336,得:
5 ( C 27 6 + C 6 1 C 27 5 + C 6 2 C 27 4 ) + 10 ( 15 C 6 4 C 27 2 + C 6 3 C 27 3 ) + 200 ( 15 C 6 5 C 27 1 + C 6 4 C 27 2 ) + 3000 C 6 5 C 27 1 + a + 15 b > 32 C 33 6 5(C_{27}^6+C_6^1C_{27}^5+C_6^2C_{27}^4)+10(15C_6^4C_{27}^2+C_6^3C_{27}^3)+200(15C_6^5C_{27}^1+C_6^4C_{27}^2)+3000C_6^5C_{27}^1+a+15b>32C_{33}^6 5(C276+C61C275+C62C274)+10(15C64C272+C63C273)+200(15C65C271+C64C272)+3000C65C271+a+15b>32C336
所以,赚钱条件即为 ∑ n i x i > n 0 x 0 \sum n_ix_i>n_0x_0 ∑nixi>n0x0,其中 n 0 n_0 n0为游戏中的所有可能性, n i n_i ni为中第i等奖的所有可能性; x 0 x_0 x0为每注成本, x i x_i xi为每注得第i等奖时的奖金。
化简上式中的各C值可得 5218200 + 1374750 + 1076400 + 99000 + a + 15 b > 35442176 5218200+1374750+1076400+99000+a+15b>35442176 5218200+1374750+1076400+99000+a+15b>35442176。
移项可得 a + 15 b > 27673826 a+15b>27673826 a+15b>27673826。
结论
当双色球的一等奖奖金为a元/注,二等奖奖金为b元/注时,若满足
a
+
15
b
>
27673826
a+15b>27673826
a+15b>27673826,则该彩票的数学期望大于0。
将一等奖奖金作为纵坐标,二等奖奖金作为横坐标并绘制每年的各期双色球的奖金的散点图,并将上述条件画成一条直线,结果如下图。
从图中可见:
- 2008年以后就不再有在直线右上方的散点,即期望>0的期数,且2016年之后一等奖奖金不再超过1e7(一千万)。因此,从2008年以后,买双色球必亏无疑(指数学期望<0)。
- 一等奖的奖金逐渐收敛至5e6~1e7(五百万至一千万)之间,同时二等奖的奖金在逐年减少,且奖金点趋于集中在一个顶点为(0,5e6),底边满足a=1e7的钝角三角形区域。
- 红点为一年当中所有奖金点的算术平均值,它收敛于(1.9e5,7.7e6)附近。因此,每张彩票的数学期望= a + 15 b 27673826 − 1 \frac{a+15b}{27673826}-1 27673826a+15b−1= 1.9 × 1 0 5 + 15 × 7 × 1 0 6 27673826 − 1 \frac{1.9×10^5+15×7×10^6}{27673826}-1 276738261.9×105+15×7×106−1= − 0.64 -0.64 −0.64元/注。平均来说,您每买一注双色球将损失0.64元。
- 此外,还有少数点的纵坐标为0,代表该期无人蒙中一等奖。
代码
爬虫和画图用的代码如下:
import numpy as np
import csv,os,re,requests,
from matplotlib import pyplot as plt
from PIL import Image
#爬虫
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'}
file=open(r"D:/双色球.csv", mode="a", encoding="utf-8-sig", newline="")
writer = csv.writer(file)
for Year in range(20,23):
year=str(Year).rjust(2,"0")
for Episode in range(1,160):
episode=str(Episode).rjust(3,"0")
response = requests.get('https://kaijiang.500.com/shtml/ssq/'+year+episode+'.shtml',headers=headers)
response.encoding = 'GBK'
response.encoding = 'utf-8'
ab,a,b = re.split('<tr align="center">',response.text,5),"",""
try:
x,y = ab[3].split('\t'),ab[4].split('\t')
x,y = x[21],y[21]
for i in x:
if '0'<=i<='9':a+=i
for i in y:
if '0'<=i<='9':b+=i
try:a=int(a)
except:a=0
try:b=int(b)
except:b=0
writer.writerow([year+episode,a,b])
except:
writer.writerow([year+episode,0,0])
if(Episode%10==0):print(Year,Episode)
#画图
X=[]#二等奖向量
Y=[]#一等奖向量
file=open(r"D:/双色球.csv", mode="r", encoding="utf-8-sig")
reader = csv.reader(file)
Year="03"
for row in reader:
if row[0][0]>'2':year='0'+row[0][0]
else:year=row[0][:2]
if year==Year:
a,b=int(row[1]),int(row[2])
X+=[b]
Y+=[a]
else:
plt.scatter(X,Y)
plt.scatter(sum(X)/len(X),sum(Y)/len(Y),color="red")
plt.plot([0,1844922],[27673826,0])
plt.xlabel("2nd")
plt.ylabel("1st")
plt.title("1st and 2nd prizes in Year"+Year)
plt.savefig(fname=r"D:/"+Year+".png")
plt.show()
Year=year
X=[]
Y=[]
a,b=int(row[1]),int(row[2])
X+=[b]
Y+=[a]
plt.scatter(X,Y)
plt.scatter(sum(X)/len(X),sum(Y)/len(Y),color="red")
plt.plot([0,1844922],[27673826,0])
plt.xlabel("2nd")
plt.ylabel("1st")
plt.title("1st and 2nd prizes in Year"+Year)
plt.savefig(fname=r"D:/"+Year+".png")
plt.show()
#将png图片组合成gif动图
im = Image.open(r'D:\03.png')
images = []
images.append(Image.open(r'D:\04.png'))
images.append(Image.open(r'D:\05.png'))
images.append(Image.open(r'D:\06.png'))
images.append(Image.open(r'D:\07.png'))
images.append(Image.open(r'D:\08.png'))
images.append(Image.open(r'D:\09.png'))
images.append(Image.open(r'D:\10.png'))
images.append(Image.open(r'D:\11.png'))
images.append(Image.open(r'D:\12.png'))
images.append(Image.open(r'D:\13.png'))
images.append(Image.open(r'D:\14.png'))
images.append(Image.open(r'D:\15.png'))
images.append(Image.open(r'D:\16.png'))
images.append(Image.open(r'D:\17.png'))
images.append(Image.open(r'D:\18.png'))
images.append(Image.open(r'D:\19.png'))
images.append(Image.open(r'D:\20.png'))
images.append(Image.open(r'D:\21.png'))
images.append(Image.open(r'D:\22.png'))
im.save(r'D:\双色球.gif', save_all=True, append_images=images, loop=1, duration=1000, comment="")
刮刮乐(好运十倍)的数学期望
绪论
玩法:该彩票的成本为-10元/张,其中有一个目标和10行数字,前3行有8个数字,后7行分别有7、6、5、……、1个数字。根据百度图片搜索可推测,这些数字最小为1,最大为56。在这10行数字中,如有任一数字与目标匹配,则可得到数字所在行末尾的奖金。如果有数字10,则可得到数字所在行末尾的奖金的10倍。中奖金额有10、20、30、40、50、60、100、200、500、1000、5000、400000共12种。
注意事项:假设56种数字出现的概率相同,同一行出现n个目标数字则获得该行末尾奖金的n倍;在此基础上,该行出现m个10时,则获得该行末尾奖金的(10m+n)倍。同时,假设目标不为10。
推导过程
假设12种奖金出现的几率相同,则每行的基本奖金期望为 10 + 20 + 30 + . . . + 400000 12 \frac{10+20+30+...+400000}{12} 1210+20+30+...+400000=33917.5元,与事实不符。
在不清楚各种奖金出现的概率时,可以假设每种奖金出现的概率等于其倒数的k倍,则有 k ( 1 10 + 1 20 + 1 30 + . . . + 1 400000 ) = 1 k(\frac1{10}+\frac1{20}+\frac1{30}+...+\frac1{400000})=1 k(101+201+301+...+4000001)=1,将12种奖金“并联”可得k=10//20//30//…//400000≈3.8。在这种情况下,每行的基本奖金期望=12×3.8元=+45.6元,所以在下面推导期望时可将每行的奖金看做**+45.6元**。一般地,假设有n种不同的奖金,每种奖金出现的概率等于其倒数的k倍时,k为n种奖金的并联值,奖金的期望=nk。
假设一行有n个数,每个数与目标相同的概率= 55 56 × 55 = 1 56 \frac{55}{56×55}=\frac1{56} 56×5555=561,出现10的概率也为 1 56 \frac1{56} 561。该行中出现a个目标和b个10的概率为 C n a C n − a b ( 1 56 ) a + b ( 55 56 ) n − a − b C_n^aC_{n-a}^b(\frac1{56})^{a+b}(\frac{55}{56})^{n-a-b} CnaCn−ab(561)a+b(5655)n−a−b,所以该行的总数学期望则为 E ( n ) = + 45.6 ∑ a = 0 n ∑ b = 0 n − a ( a + 10 b ) C n a C n − a b ( 1 56 ) a + b ( 55 56 ) n − a − b E(n)=+45.6\sum_{a=0}^n\sum_{b=0}^{n-a}(a+10b)C_n^aC_{n-a}^b(\frac1{56})^{a+b}(\frac{55}{56})^{n-a-b} E(n)=+45.6∑a=0n∑b=0n−a(a+10b)CnaCn−ab(561)a+b(5655)n−a−b元。根据该公式,可算出的10行的总数学期望为+512.65元,整张彩票的总数学期望为+502.65元。
结论
任何期望大于0的结果都与事实不符。
- 在现实中,彩票中数字10出现的概率微乎其微,应将其忽略不计。排除数字10以后,每行数字对应的奖金的数学期望为 E 0 ( n ) = + 45.6 ∑ a = 1 n a C n a ( 1 56 ) a ( 55 56 ) n − a E_0(n)=+45.6\sum_{a=1}^naC_n^a(\frac1{56})^a(\frac{55}{56})^{n-a} E0(n)=+45.6∑a=1naCna(561)a(5655)n−a元。但即使这样计算,整张彩票的总数学期望仍为42.34元/张,仍与事实不符。
- 在现实中,彩票的每个数字与目标相同的概率也很小,且各个数字出现的概率是未知且可操控的。假设目标出现的概率为p,则每行数字对应的奖金的数学期望为 E 1 ( n ) = + 45.6 ∑ a = 1 n a C n a p a ( 1 − p ) n − a = + 45.6 n p E_1(n)=+45.6\sum_{a=1}^naC_n^ap^a(1-p)^{n-a}=+45.6np E1(n)=+45.6∑a=1naCnapa(1−p)n−a=+45.6np元,且有 E 1 ( 1 ) + E 1 ( 2 ) + E 1 ( 3 ) + E 1 ( 4 ) + E 1 ( 5 ) + E 1 ( 6 ) + E 1 ( 7 ) + 3 E 1 ( 8 ) < 10 E_1(1)+E_1(2)+E_1(3)+E_1(4)+E_1(5)+E_1(6)+E_1(7)+3E_1(8)<10 E1(1)+E1(2)+E1(3)+E1(4)+E1(5)+E1(6)+E1(7)+3E1(8)<10。这里用到了一点高中的多项式展开和求导的小知识。
- 整张彩票有52个数字,故有 45.6 × 52 p < 10 45.6×52p<10 45.6×52p<10,解之得 p < 25 5928 ≈ 1 240 p<\frac{25}{5928}≈\frac1{240} p<592825≈2401。综上所述,数字与目标匹配的概率小于约 1 240 \frac1{240} 2401时,好运十倍的期望不大于0。在p不超过 1 240 \frac1{240} 2401时,每张彩票出现目标数字的概率不超过 1 − ( 1 − 1 240 ) 52 ≈ 0.1952 ≈ 1 5 1-(1-\frac{1}{240})^{52}≈0.1952≈\frac15 1−(1−2401)52≈0.1952≈51。
- 综上所述,如果“每种奖金出现的概率与其倒数成正比”,则要在保证每5张彩票中至少有1张包含目标数字,彩票的数学期望才为正。而每种奖金出现的概率是未知的,甚至可能被人为操控。笔者在刮这类彩票的时候发现,“一行是否包含目标数字”与该行的奖金也不是两个独立的变量。
代码
在包含数字10时,求10行数字的总期望所用的代码:
def E(n):
y=0
for a in range(n+1):
for b in range(0,n-a+1):
y+=(a+10*b)*C(n,a)*C(n-a,b)*(1/56)**(a+b)*(55/56)**(n-a-b)
return y*45.6
print(sum([E(8),E(8)]+[E(i+1) for i in range(8)]))
其它情况以此类推。
备注
求 C a b C_a^b Cab的函数:
def C(a,b):
y=1
for i in range(b):
y*=a-i
y/=i+1
return y