利用概率理论预测和决策
老样子,书还是用一个情境帮助我们学习概率:假如你在一个赌场,你有一些筹码,“轮盘赌”正在进行,对此你也非常的感兴趣。
轮盘赌简介
庄家转动一个轮盘,随后朝相反方向掷出一个小球,赌者将赌注押在他所料定的停球位置。
肥蛋赌场所用轮盘有38个停球位置,主球位编号1-36,颜色或黑或红;另有两个球位编号0和00,均为绿色。轮盘赌样子如下:
轮盘赌的下注方式五花八门。例如,可以读一个特定数字(奇偶均可),可以赌球位颜色,开局后还会有人宣布各种其他赌法。再就是记住:如果停在绿色球位,你就输了。
使用轮盘板可以方便地查看数字与颜色组合:
概率与事件
概率是量度某事发生几率的一种数量指标。你可以用概率衡量发生某件事的可能性或者不会发生某事的可能性。
事件,统计学用它表示有概率可言的任何事情,换句话说,事件就是人们能指出其发生可能性的任何事情。
概率的量度尺度是0-1,0表示不可能发生,1表示必然发生。下面是用概率比例尺示意的几个例子:
事件:有概率可言的一个结果或一件事
书上的例子可以帮助理解,轮盘板共有38个球位,数字7有1个球位,那么“停球结果为7”的概率为1/38=0.026,其概率非常的小,我们最好不要这么猜。
由上可知,我们的计算公式为:
概 率 = 押 中 赌 注 的 可 能 数 目 所 有 可 能 结 果 的 数 目 概率 = \frac{押中赌注的可能数目}{所有可能结果的数目} 概率=所有可能结果的数目押中赌注的可能数目
更通用的方法来表述概率,对于事件A的概率:
P ( A ) = n ( A ) n ( S ) P(A) = \frac{n(A)}{n(S)} P(A)=n(S)n(A)
S被称为概率空间,或称样本空间,是表示所有可能结果的一种简便表示法。可能发生的时间都是S的子集。
举个例子,投掷一个硬币,S为“硬币为正面+硬币为反面”,事件A我们可以规定为“硬币为正面”,那么 P ( A ) = 1 1 + 1 = 1 2 P(A) = \frac{1}{1+1} = \frac{1}{2} P(A)=1+11=21
维恩图
维恩图可以帮助我们用图形的方式表示概率。其方法是这样的:画一个方框表示样本空间S,然后画几个圆圈代表各个相关事件。
在维恩图上,可以标明数字,或者实际概率,或者不标,取决于你自己。
对立事件
对立事件A’:表示 “A不发生”事件。由于A’包含事件A所不包含的所有可能性,因此A和A’肯定包含每一种可能发生的事件。也就是上面图片中,A为圆圈,A’为圆圈外长方形内的图形。
例如,轮盘赌停在数字7是事件A,那么对立事件A’表示轮盘赌不停在数字7。它们的概率之和肯定为1。
P
(
A
)
+
P
(
A
′
)
=
1
P
(
A
′
)
=
1
−
P
(
A
)
P(A) + P(A') = 1 \\ P(A') = 1 - P(A)
P(A)+P(A′)=1P(A′)=1−P(A)
问:有没有什么东西能同时存在于事件A和事件A’中?
答:没有。A’的意思是不存在A中的各种事物。如果某个要素存在于A中,则这个要素不可能存在于A’中。这两个事件是相斥的,因此两者不会共用任何要素。
互斥事件的相加
如果我们要赌球停在红色或黑色位置上,我们这样计算(这里表示把事件A看成黑或红的数目):
P
(
黑
或
红
)
=
36
38
=
0.947
P(黑或红) = \frac{36}{38} = 0.947
P(黑或红)=3836=0.947
还可以这样计算(这里表示两个事件的相加):
P
(
黑
或
红
)
=
P
(
黑
)
+
P
(
红
)
=
18
38
+
18
38
=
0.947
P(黑或红) = P(黑) + P(红) = \frac{18}{38} + \frac{18}{38} = 0.947
P(黑或红)=P(黑)+P(红)=3818+3818=0.947
我们也可以这样计算(这里表示取其对立事件 - 绿’):
P
(
黑
或
红
)
=
P
(
绿
′
)
=
1
−
P
(
绿
)
=
1
−
0.053
=
0.947
P(黑或红) = P(绿') \\ = 1 - P(绿) \\ = 1 - 0.053 \\ = 0.947
P(黑或红)=P(绿′)=1−P(绿)=1−0.053=0.947
因为黑和红,两者是互斥事件,可以用上面的三种方法计算。
互斥事件与相交事件
互斥事件:如果两个事件是互斥事件,则只有其中一个事件会发生。
例子:小球停在黑色球位和小球停在红色球位只有一件事能发生,不能同时发生。
相交事件:如果两个事件相交,则这两个事件有可能同时发生。
例子:小球停住黑色球位和小球停在偶数球位,它们有可能同时发生(当然啦也可能不同时发生,比如停在黑色奇数球位上)。
交集与并集
如果要计算“停球结果为黑色或偶数”的结果,我们不能像上面“黑色或红色”一样直接相加,这样会导致将“黑色兼偶数”球位算了两次。
如果 P ( 黑 或 偶 ) = P ( 黑 ) + P ( 偶 ) P(黑或偶) = P(黑) + P(偶) P(黑或偶)=P(黑)+P(偶),这样会导致中间的黑色部分被加了两次。
所以我们需要这样计算:
P ( 黑 或 偶 ) = P ( 黑 ) + P ( 偶 ) − P ( 黑 兼 偶 ) = 18 / 38 + 18 / 38 − 10 / 38 = 26 / 38 = 0.684 P(黑或偶) = P(黑) + P(偶) - P(黑兼偶) = 18/38 + 18/38 - 10/38 = 26/38 = 0.684 P(黑或偶)=P(黑)+P(偶)−P(黑兼偶)=18/38+18/38−10/38=26/38=0.684
并集与交集
在统计学中,可以有更简便的数学符号,上面的“或”是“并集”( ∪ \cup ∪)的表示,上面的“兼”是“交集”( ∩ \cap ∩)的表示。
A ∩ B A \cap B A∩B表示“A与B的交集”,这里符号可以被理解为“与”,它求出不同事件的共同要素。
A ∪ B A \cup B A∪B表示“A与B的并集”,这个符号可以被理解为“或”,它包含数据A及B的所有要素。
如果P( A ∪ B A \cup B A∪B)=1,则我们说A与B穷举。它们一起形成整个S,它们穷举所有可能性。
因此,上面的式子也可以写成:
P ( 黑 ∪ 偶 ) = P ( 黑 ) + P ( 偶 ) − P ( 黑 ∩ 偶 ) P(黑 \cup 偶) = P(黑) + P(偶) - P(黑 \cap 偶) P(黑∪偶)=P(黑)+P(偶)−P(黑∩偶)
A或B公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
互斥与穷举
- 如果事件A与事件B为互斥事件,则 P ( A ∩ B ) = 0 P(A \cap B) = 0 P(A∩B)=0,随后 P ( A ∪ B ) = P ( A ) + P ( B ) − 0 P(A \cup B) = P(A) + P(B) - 0 P(A∪B)=P(A)+P(B)−0
- 如果事件A与事件B为穷举事件,则 P ( A ∪ B ) = 1 P(A \cup B) = 1 P(A∪B)=1
这里有一道例题,大家可以思考一下再看答案:
小知识:A和A’是互斥的,也是穷举的
P ( A ) = P ( A ∩ B ) + P ( A ∩ B ′ ) P(A) = P(A \cap B) + P(A \cap B') P(A)=P(A∩B)+P(A∩B′)