01.第一章事件及其概率(1)_最小σ代数例题-CSDN博客

本文链接：https://blog.csdn.net/jingye333/article/details/108701946

第一章事件及其概率(1)

1.概率的统计定义

将自然界中的事件分为两种：一种是发生结果确定的，可以分为必然事件与不可能事件；另一种则是某个结果可能发生也可能不发生，称为随机事件。对于某种试验，可能出现多种可能结果，出现的每个结果称为随机事件，简称事件。不同事件发生的可能性有大有小，这种可能性大小的量化指标称为事件的概率。

对于可以重复进行的试验，如果每一次试验之间互不影响，那么，如果 $N$ 次试验中发生了 $n$ 次事件 $A$ ，则称 $A$ 在 $N$ 次试验中出现的频率为 $F_N(A)=\frac nN$ 。随着 $N$ 的增大，频率会收敛于一个常数 $P (A)$ ，将这个常数称为事件 $A$ 发生的概率，这就是概率的统计定义。

事件的频率与概率都具有三个基本性质：

非负性： $F_A(N)\ge 0,P(A)\ge 0$ 。
规范性：对必然事件 $\Omega$ ，有 $F_N(\Omega)=1,P(\Omega)=1$ 。
可加性：对两个不会同时发生的事件 $A, B$ ，记 $A + B$ 为 $A$ 或 $B$ 至少出现其一这一事件，则 $F_N(A+B)=F_N(A)+F_N(B),P(A+B)=P(A)+P(B)$ 。这一性质可以推广到任意有限个事件。

2.古典概型与几何概型

样本空间与样本点：对于某一个随机试验，将每一个可能发生的事件用一个样本点 $\omega_i$ 代替，则所有这样的样本点构成样本空间 $\Omega$ ，即
$\Omega=\{\omega_1,\omega_2,\cdots,\omega_n\}$
当然，并不是所有的样本空间中包含的样本点都是有限的或者可列的，但对于每一次试验，一定会发生有且仅有一个样本点。对同一个问题，可以设置不同的样本空间和样本点，在讨论具体问题前要先明确样本空间和样本点。

有两类特殊的样本空间，分别对应着古典概型和几何概型。

古典概型的特点是：样本空间是有限的，且每个样本点发生的概率相同。这样，如果样本空间含 $n$ 个样本点，且事件 $A$ 恰好包含其中的 $m$ 个样本点，则有
$P(A)=\frac mn=\frac{A包含的样本点数}{样本空间中样本点的总数}$
古典概型还可以推广到每个样本点发生概率不同的情况，如果 $\Omega=\{\omega_1,\cdots,\omega_n\}$ ，且样本点 $\omega_i$ 发生的概率为 $p_i>0$ ， $\sum\limits_{i=1}^n p_i=1$ 。这样，事件 $A$ 的概率可以写成
$P(A)=\sum_{i:\omega_i\in A}p_i$
几何概型的样本空间 $\Omega$ 是一个包含无限个点的区域（维数不限），样本点是区域中的每一个点，这样，如果事件 $A_g$ 包含的样本点构成区域 $g$ ，则有
$P(A_g)=\frac{g的测度}{\Omega的测度}$

3.概率的公理化定义

现在将样本空间看作讨论问题的全集 $\Omega$ ，样本点是集合中的元素，那么事件可以被定义为样本点的集合。如果某一次实验中样本点 $\omega$ 出现且 $\omega\in A$ ，则称事件 $A$ 发生。同时将 $\Omega$ 看成必然事件， $\emptyset$ 看成不可能事件，则每一个样本点的集合对应一个事件，这样就可以用集合论的方法来研究事件。

类似集合，定义事件之间的关系：

$A\supset B$ ： $A$ 包含 $B$ ，即 $\forall \omega \in B,\omega \in A$ 。
$A = B$ ： $A$ 与 $B$ 相等，即 $A\supset B,B\supset A$ 。
$A\cup B$ ： $A$ 与 $B$ 的并事件，即 $A, B$ 至少发生一个。
$A\cap B$ ： $A$ 与 $B$ 的交事件，即 $A, B$ 都发生，也记作 $A B$ 。
$A\setminus B$ ： $A$ 与 $B$ 的差事件，即 $A$ 发生但 $B$ 不发生。如果有 $B\sub A$ ，则也可以记作 $A - B$ 。
$A\cap B=\empty$ ：代表 $A, B$ 不会同时发生，即互不相容。
$\bar A$ ：代表 $A$ 的逆（对立）事件，即 $A$ 不发生。

关于这些事件间关系，有以下的运算关系：

$A\cup B=B\cup A$ ， $A B = B A$ 。
$(A\cup B)\cup C=A\cup (B\cup C)$ ， $(A B) C = A (B C)$ 。
$(A\cup B)C=AC\cup BC$ ， $(AB)\cup C=(A\cup C)(B\cup C)$ 。
$\overline {A\cup B}=\bar A\bar B$ ， $\overline {AB}=\bar A \cup \bar B$ 。
$A\setminus B=A \bar B$ 。

运用以上事件之间的运算关系，可以由一系列基本事件表达复杂事件。

用集合定义了事件以后，就可以描述概率空间了。概率空间是一个由样本空间、事件域、概率组成的三元组 $(\Omega,\mathscr F,P)$ 。

这里 $\Omega$ 是样本空间，也就是样本点的全体，根据问题适当选择。

$\mathscr F$ 是事件域，也就是事件的集合，而事件又是样本点的集合，也就是说 $\mathscr F$ 中的元素都是由样本点构成的集合。同时，一个事件域 $\mathscr F$ 还需要满足以下条件：

$\Omega \in \mathscr F$ 。
若 $A\in \mathscr F$ ，则有 $\bar A\in \mathscr F$ 。
若 $A_1,\cdots,A_n,\cdots\in \mathscr F$ ，则 $\bigcup\limits_{i=1}^\infty A_i\in \mathscr F$ 。

满足以上三个条件的事件域 $\mathscr F$ 称为 $\sigma$ -代数。并且可以推出对于任何一个事件域，必然事件、不可能事件、事件的逆、有限并、有限交、可列无限并、可列无限交等等在事件域内。最小的事件域是 $\{\Omega ,\empty\}$ 。

有一种特殊的 $\sigma$ -代数称为（一维）Borel $\sigma$ -代数，它的样本空间是 $\Omega=\R$ ，取一切左开右闭区间以及它们的并、交、逆所构成的集合为事件域 $\mathscr F$ ，这样的事件域 $\mathscr F$ 称为Borel $\sigma$ -代数。
对于样本空间 $\Omega$ 为有限或可列个样本点组成的情况，常常取事件域 $\mathscr F$ 为一切 $\Omega$ 的子集构成的集合。
如果只对 $\Omega$ 的一个子集 $A$ 感兴趣，则包含 $A$ 的最小 $\sigma$ -代数是 $\{\empty,A,\bar A,\Omega\}$ 。

概率 $P$ 指的是定义在 $\mathscr F$ 上的函数 $A\mapsto P$ ，并且满足：

非负性： $P(A)\ge 0$ 。
规范性： $P(\Omega)=1$ 。
可列可加性：若 $A_1,\cdots,A_n,\cdots$ 两两不相容，则 $P(\sum\limits_{i=1}^n A_i)=\sum\limits_{i=1}^n P(A_i)$ 。

需要注意的是，概率的公理化定义并不能简化事件概率的计算，只是为概率理论奠定了基础，因此只需要能识别并区分样本空间、事件域以及明确概率是定义在事件域上的函数即可。

由于事件用集合来定义，再结合概率的基本性质，可以推导出事件的概率具有以下的性质：

$P(\empty )=0$ ，由于 $\Omega=\Omega+\empty+\empty+\cdots$ ，对两边同时求概率并由不相容事件的可列可加性，可以得到
$P(\Omega)=P(\Omega)+P(\empty)+P(\empty)+\cdots$
又由于概率的非负性，有 $P(\empty)=0$ 。
有限可加性：对于不相容的一列事件 $A_1,\cdots,A_n$ ，有
$P(\sum_{i=1}^n A_i)=\sum_{i=1}^n P(A_i)$
只要将有限事件列扩展为无限事件列 $A_1,\cdots,A_n,\empty,\cdots$ 即可。
若 $B\sub A$ ，则 $P (A - B) = P (A) - P (B)$ 。只需令 $A = B + (A - B)$ ，显然有 $B$ 与 $A - B$ 不相容，那么有 $P (A) = P (B) + P (A - B)$ 。
$P(A\cup B)=P(A)+P(B)-P(AB)$ ，这里 $A\cup B=A\cup (B-AB)$ ，且 $A\cap (B-AB)=\empty,AB\sub B$ ，于是
$P(A\cup B)=P(A)+P(B-AB)=P(A)+P(B)-P(AB)$
多还少补定理：
$P(A_1\cup\cdots\cup A_n)=\sum_{i=1}^n P(A_i)-\sum_{1\le i<j\le n} P(A_i A_j)+\cdots+(-1)^{n-1}P(A_1\cdots A_n)$
可以从4由归纳法证明。
次可加性： $P(\bigcup\limits_{i=1}^N A_i)\le \sum\limits_{i=1}^N P(A_i)$ 。

概率测度具有连续性，这指的是对于一系列单调增加的事件序列 $A_1\sub A_2\sub\cdots\sub A_n\sub \cdots$ ，具有极限 $A$ ，即 $\lim\limits_{n\to \infty} A_n=\bigcup\limits_{i=1}^\infty A_i =A$ ，则有
$P(\lim_{n\to \infty }A_n)=P(A)=\lim_{n\to \infty }P(A_n)$
同理对于一列单调减少的事件序列 $A_1\supset A_2\supset \cdots\supset A_n \supset \cdots$ ，具有极限 $A$ ，即 $\lim\limits_{n\to \infty}A_n=\bigcap\limits_{i=1}^\infty A_i=A$ ，同样有
$P(\lim_{n\to \infty} A_n)=P(A)=\lim_{n\to \infty }P(A_n)$