文章目录
前言
1 第一章 概率论引论 总结
第一章从事件的角度引出样本空间、事件、概率的基本定义,并且介绍条件概率、独立性,贝叶斯公式的事件形式
1.1 样本空间与事件
样本(sample):某次试验的可能结果(outcome)
样本空间(sample space):所有样本的可能结果
事件(event):样本空间的一个 子集
1.2 定义在事件上的概率
- 概率定义
概率定义(probabiliity):概率是定义在事件上的函数 ,需要满足以下条件
(i) 0 ⩽ P ( E ) ⩽ 1 0 \leqslant \mathrm{P}(E) \leqslant 1 0⩽P(E)⩽1.
(ii) P ( S ) = 1 \mathrm{P}(S)=1 P(S)=1.
(iii) 对于任意互不相容的事件序列 E 1 , E 2 , ⋯ E_1, E_2, \cdots E1,E2,⋯, 即当 n ≠ m n \neq m n=m 时 E n E m = ∅ E_n E_m=\varnothing EnEm=∅ 的事 件序列, 有
P ( ⋃ n = 1 ∞ E n ) = ∑ n = 1 ∞ P ( E n ) \mathrm{P}\left(\bigcup_{n=1}^{\infty} E_n\right)=\sum_{n=1}^{\infty} \mathrm{P}\left(E_n\right) P(n=1⋃∞En)=n=1∑∞P(En)
我们将 P ( E ) \mathrm{P}(E) P(E) 称为事件 E E E 的概率.
注意条件三,他给了我们 在事件独立时求和概率的一个公式
- 容斥恒等式
P ( E 1 ∪ E 2 ∪ ⋯ ∪ E n ) = ∑ i P ( E i ) − ∑ i < j P ( E i E j ) + ∑ i < j < k P ( E i E j E k ) − ∑ i < j < k < l P ( E i E j E k E l ) + ⋯ + ( − 1 ) n + 1 P ( E 1 E 2 ⋯ E n ) \begin{aligned} \mathrm{P}\left(E_1 \cup E_2 \cup \cdots \cup E_n\right)= & \sum_i \mathrm{P}\left(E_i\right)-\sum_{i<j} \mathrm{P}\left(E_i E_j\right)+\sum_{i<j<k} \mathrm{P}\left(E_i E_j E_k\right)- \\ & \sum_{i<j<k<l} \mathrm{P}\left(E_i E_j E_k E_l\right)+\cdots+(-1)^{n+1} \mathrm{P}\left(E_1 E_2 \cdots E_n\right) \end{aligned} P(E1∪E2∪⋯∪En)=i∑P(Ei)−i<j∑P(EiEj)+i<j<k∑P(EiEjEk)−i<j<k<l∑P(EiEjEkEl)+⋯+(−1)n+1P(E1E2⋯En)
1.3 条件概率
P ( E ∣ F ) = P ( E F ) P ( F ) \mathrm{P}(E \mid F)=\frac{\mathrm{P}(E F)}{\mathrm{P}(F)} P(E∣F)=P(F)P(EF)
1.4 独立事件
- 独立的定义
如果
P ( E F ) = P ( E ) P ( F ) \mathrm{P}(E F)=\mathrm{P}(E) \mathrm{P}(F) P(EF)=P(E)P(F)
那么两个事件 E E E 和 F F F 称为独立的(independent). 由公式 (1.5), 这蕴涵了如果
P ( E ∣ F ) = P ( E ) \mathrm{P}(E \mid F)=\mathrm{P}(E) P(E∣F)=P(E)
那么 E 和 F 也是独立的
这反过来也成立
注意:两两独立不一定联合独立
例 1.10 (不独立的两两独立事件) 假定从装有号码分别为 1 , 2 , 3 , 4 1,2,3,4 1,2,3,4 的 4 个球的瓮中 抽取一个球. 设 E = { 1 , 2 } , F = { 1 , 3 } , G = { 1 , 4 } E=\{1,2\}, F=\{1,3\}, G=\{1,4\} E={1,2},F={1,3},G={1,4}. 如果所有 4 个结果都是等可能 的, 那么
P ( E F ) = P ( E ) P ( F ) = 1 4 P ( E G ) = P ( E ) P ( G ) = 1 4 P ( F G ) = P ( F ) P ( G ) = 1 4 \begin{aligned} & \mathrm{P}(E F)=\mathrm{P}(E) \mathrm{P}(F)=\frac{1}{4} \\ & \mathrm{P}(E G)=\mathrm{P}(E) \mathrm{P}(G)=\frac{1}{4} \\ & \mathrm{P}(F G)=\mathrm{P}(F) \mathrm{P}(G)=\frac{1}{4} \end{aligned} P(EF)=P(E)P(F)=41P(EG)=P(E)P(G)=41P(FG)=P(F)P(G)=41
然而
1 4 = P ( E F G ) ≠ P ( E ) P ( F ) P ( G ) \frac{1}{4}=\mathrm{P}(E F G) \neq \mathrm{P}(E) \mathrm{P}(F) \mathrm{P}(G) 41=P(EFG)=P(E)P(F)P(G)
因此, 即使事件 E , F , G E, F, G E,F,G 是两两独立的, 它们并非是联合独立的.
- 独立随机试验:假定有一个试验序列, 每个试验的结果或者是 “成功” 或者是 “失败”. 以
E
i
(
i
⩾
E_i(i \geqslant
Ei(i⩾ 1) 记第
i
i
i 个试验的结果是成功这一事件. 如果对于所有的
i
1
,
i
2
,
⋯
,
i
n
i_1, i_2, \cdots, i_n
i1,i2,⋯,in,
P ( E i 1 E i 2 ⋯ E i n ) = ∏ j = 1 n P ( E i j ) \mathrm{P}\left(E_{i_1} E_{i_2} \cdots E_{i_n}\right)=\prod_{j=1}^n \mathrm{P}\left(E_{i_j}\right) P(Ei1Ei2⋯Ein)=j=1∏nP(Eij)
我们就说这个试验序列由独立的试验(independent trails) 组成.
2 一些有用的重要结论/公式/例题
-
概率定义:若事件互不相容则
P ( ⋃ n = 1 ∞ E n ) = ∑ n = 1 ∞ P ( E n ) \mathrm{P}\left(\bigcup_{n=1}^{\infty} E_n\right)=\sum_{n=1}^{\infty} \mathrm{P}\left(E_n\right) P(n=1⋃∞En)=n=1∑∞P(En) -
容斥恒等式:容斥恒等式说明了事件的和可以从每个事件的概率和每个事件的交集求得
P ( E 1 ∪ E 2 ∪ ⋯ ∪ E n ) = ∑ i P ( E i ) − ∑ i < j P ( E i E j ) + ∑ i < j < k P ( E i E j E k ) − ∑ i < j < k < l P ( E i E j E k E l ) + ⋯ + ( − 1 ) n + 1 P ( E 1 E 2 ⋯ E n ) \begin{aligned} \mathrm{P}\left(E_1 \cup E_2 \cup \cdots \cup E_n\right)= & \sum_i \mathrm{P}\left(E_i\right)-\sum_{i<j} \mathrm{P}\left(E_i E_j\right)+\sum_{i<j<k} \mathrm{P}\left(E_i E_j E_k\right)- \\ & \sum_{i<j<k<l} \mathrm{P}\left(E_i E_j E_k E_l\right)+\cdots+(-1)^{n+1} \mathrm{P}\left(E_1 E_2 \cdots E_n\right) \end{aligned} P(E1∪E2∪⋯∪En)=i∑P(Ei)−i<j∑P(EiEj)+i<j<k∑P(EiEjEk)−i<j<k<l∑P(EiEjEkEl)+⋯+(−1)n+1P(E1E2⋯En) -
条件概率公式
P ( E ∣ F ) = P ( E F ) P ( F ) \mathrm{P}(E \mid F)=\frac{\mathrm{P}(E F)}{\mathrm{P}(F)} P(E∣F)=P(F)P(EF)
- 独立随机试验:假定有一个试验序列, 每个试验的结果或者是 “成功” 或者是 “失败”. 以
E
i
(
i
⩾
E_i(i \geqslant
Ei(i⩾ 1) 记第
i
i
i 个试验的结果是成功这一事件. 如果对于所有的
i
1
,
i
2
,
⋯
,
i
n
i_1, i_2, \cdots, i_n
i1,i2,⋯,in,
P ( E i 1 E i 2 ⋯ E i n ) = ∏ j = 1 n P ( E i j ) \mathrm{P}\left(E_{i_1} E_{i_2} \cdots E_{i_n}\right)=\prod_{j=1}^n \mathrm{P}\left(E_{i_j}\right) P(Ei1Ei2⋯Ein)=j=1∏nP(Eij)
我们就说这个试验序列由独立的试验(independent trails) 组成.
这个式子在许多领域都有很多应用,例如机器学习时,如果样本为 i.i.d 即独立同分布的,从总体中抽取n个样本作为数据集 X X X 的概率即为
P ( X ) = ∏ i = 1 n P ( x i ) \mathrm{P}(X)=\prod_{i=1}^n \mathrm{P}\left(x_i\right) P(X)=i=1∏nP(xi)
3 重要例题
例 1.11
有 r r r 个参赛人, 其中参赛人 i ( i = 1 , ⋯ , r ) i(i=1, \cdots, r) i(i=1,⋯,r) 在开始时有 n i ( n i > 0 ) n_i\left(n_i>0\right) ni(ni>0) 个 单位 (财富). 在每一阶段参赛人中的两个被选中比赛, 赢者从输者那里得到一个 单位. 任何参赛人, 当他的财富减少到 0 时就退出, 如此继续, 直至某个参赛人占 有所有的 n = ∑ i = 1 r n i n=\sum_{i=1}^r n_i n=∑i=1rni 个单位为止, 此参赛人就是胜利者. 假定相继比赛的结果 是独立的, 而且在每次比赛中两个参赛人等可能地获胜, 求参赛人 i i i 是胜利者的 概率.
解:
- 首先, 假定有 n n n 个参赛人, 每人在开始时有 1 个单位. 考虑参赛人 i i i. 在各阶 段他以相等的可能或者赢一个单位或者输一个单位, 各阶段的结果是独立的. 此外, 他将继续参赛直到他的财富是 0 或者是 n n n. 因为对所有的参赛人是一样的, 这就推 出每个人都有同样的机会成为胜利者. 因此, 每个参赛人以概率 1 / n 1 / n 1/n 是胜利者.
- 现 在, 假设 n n n 个参赛人分成 r r r 组, 其中第 i i i 组有 n i n_i ni 人, i = 1 , ⋯ , r i=1, \cdots, r i=1,⋯,r. 也就是, 参赛人 1 , ⋯ , n 1 1, \cdots, n_1 1,⋯,n1 组成第一组, 参赛人 n 1 + 1 , ⋯ , n 1 + n 2 n_1+1, \cdots, n_1+n_2 n1+1,⋯,n1+n2 组成第二组, 依此类推. 那么, 胜 利者在第 i i i 组的概率是 n i / n n_i / n ni/n. 但是, 因为第 i i i 组在开始时的全部财富有 n i n_i ni 个单位, i = 1 , ⋯ , r i=1, \cdots, r i=1,⋯,r, 而每次比赛由不同组的成员参赛, 这就导致: 赢者所在的组的财富增加 一个单位, 同时, 输者所在的组的财富减少一个单位,每个组里的每个人都有同样的机会成为胜利者,因此每个组胜利的概率为每个组的人数即可以看出第i组胜利的概率为: n i / n n_i / n ni/n.
3 习题题解
知识点 | 题目 | 3. |
---|---|---|
样本空间与事件 | 1,2,3,4,5,6,7,8 | |
题1
- 盒中有红、绿、蓝三个弹球. 考察如下试验, 从盒中取一个弹球, 然后放回去, 再从盒中取第 二个弹球. 此试验的样本空间是什么? 如果在任意情形下, 盒中的每个弹球都是等可能地 被抽取的, 那么样本空间的每一个点的概率是多少?
使用R,G,B表示取出的星红、绿、蓝 球,样本空间为:
S
=
{
(
R
,
R
)
,
(
R
,
G
)
,
(
R
,
B
)
,
(
G
,
G
)
,
(
G
,
B
)
,
(
G
,
R
)
,
(
B
,
B
)
(
B
,
G
)
,
(
B
,
R
)
}
S={\{(R, R),(R, G),(R, B),(G, G),(G, B),(G, R),(B, B)(B, G),(B,R)\}}
S={(R,R),(R,G),(R,B),(G,G),(G,B),(G,R),(B,B)(B,G),(B,R)}
所有样本等概, 故样本空间每一个点的概率为
1
9
\frac{1}{9}
91
题2
∗ { }^* ∗ 2. 在取第二个弹球前不放回第一个弹球时, 重做习题 1.
-
抛掷一枚硬币直至正面接连地出现两次. 此试验的样本空间是什么? 如果硬币是均匀的, 问 抛掷次数恰为 4 的概率是多少?
-
设 E , F , G E, F, G E,F,G 是三个事件. 求 E , F , G E, F, G E,F,G 的下列事件的表达式.
(a) 只有 F F F 发生.
(b) E , F E, F E,F 都发生, 但是 G G G 不发生.
© 至少一个事件发生.
(d) 至少两个事件发生.
(e) 三个事件都发生.
(f) 三个事件都没有发生.
(g) 至多一个事件发生.
(h) 至多两个事件发生.
*5. 一个人在拉斯维加斯使用下面的赌博方法, 他下注 1 美元于轮盘赌的红色. 如果他歆了, 他 就离开. 如果他输了, 他再赌一次红色并下注 2 美元. 然后不管什么结果, 他都离开. 假定 他每次下注赢的概率都是
1
/
2
1 / 2
1/2. 他回家时是樂家的概率是多少? 为什么这一赌博方法并未 被每个人采用?
5. 证明
E
(
F
∪
G
)
=
E
F
∪
E
G
E(F \cup G)=E F \cup E G
E(F∪G)=EF∪EG.
6. 证明
(
E
∪
F
)
c
=
E
c
F
c
(E \cup F)^{\mathrm{c}}=E^{\mathrm{c}} F^{\mathrm{c}}
(E∪F)c=EcFc.
7. 若
P
(
E
)
=
0.9
\mathrm{P}(E)=0.9
P(E)=0.9 且
P
(
F
)
=
0.8
\mathrm{P}(F)=0.8
P(F)=0.8, 证明
P
(
E
F
)
⩾
0.7
\mathrm{P}(E F) \geqslant 0.7
P(EF)⩾0.7. 一般地, 证明
P
(
E
F
)
⩾
P
(
E
)
+
P
(
F
)
−
1
\mathrm{P}(E F) \geqslant \mathrm{P}(E)+\mathrm{P}(F)-1
P(EF)⩾P(E)+P(F)−1
这称为邦费罗尼不等式(Bonferroui’s inequality).
∗
{ }^*
∗ 9. 如果
E
E
E 中的每个点都在
F
F
F 中, 我们就说
E
⊂
F
E \subset F
E⊂F. 证明:若
E
⊂
F
E \subset F
E⊂F, 则
P
(
F
)
=
P
(
E
)
+
P
(
F
E
c
)
⩾
P
(
E
)
\mathrm{P}(F)=\mathrm{P}(E)+\mathrm{P}\left(F E^c\right) \geqslant \mathrm{P}(E)
P(F)=P(E)+P(FEc)⩾P(E)