测度与概率的定义

最新推荐文章于 2021-07-18 21:49:59 发布

Reed Fu

最新推荐文章于 2021-07-18 21:49:59 发布

阅读量3.7k

点赞数 4

分类专栏：分析学（Analysis）

本文链接：https://blog.csdn.net/qq_41885382/article/details/111592935

版权

1. 导言

微积分的学习顺序是先学微分再学积分。但是从认知上看，先辨析清楚“面积/测度/概率”的概念，再考虑相应的变化：导数/微分/分布函数，应该更加自然。我们将按照这样的顺序，介绍现代分析学和概率论的数学基础。

2. 测度/概率的直观引入

为了定义测度/概率，我们需要给一些特定的集合赋予一些数，使之满足我们对面积/概率的期望，这样自然产生了两个问题：

a. 所有的集合都可以赋予面积/概率的概念吗？

b. 这些被赋予的数应该满足什么条件，才能符合我们对面积/概率的认知？

为了回答问题a和b，我们考虑最简单的离散概率模型。考虑掷 $n$ 粒骰子，那么可能的输出结果为 $(k_1,\cdots,k_n)$ ，其中 $k_1,\cdots, k_n\in\{1,2,3,4,5,6\}$ 。这些可能的输出结果 $(k_1,\cdots,k_n)$ 称为样本，所有的输出结果形成一个集合
$\Omega=\{(k_1,\cdots,k_n):k_1,\cdots, k_n\in\{1,2,3,4,5,6\}\}，$

我们称 $\Omega$ 为样本空间。 $\Omega$ 的基数为 $6^n$ 。 $\Omega$ 的任何一个子集 $S$ 表示的是“掷骰子的结果在 $S$ 中”这一事件，这一事件我们相信是能达到的，因此， $2^{\Omega}$ 表示所有以 $\Omega$ 为样本空间的事件，称之为事件域。我们给事件域中的每个事件赋予一个数，称为该事件的概率（面积/测度），直观上，这个数应该是 $[0, 1]$ 中的任何实数。也就是定义了映射
$\mathbb{P}:2^{\Omega}\rightarrow [0,1],\mathbb{P}(k_1,\cdots,k_n)=6^{-n}$
我们现在把事件域 $2^{\Omega}$ 用 $\mathscr{F}$ 表示（这是惯例），于是我们有了一个完整的概率模型 $(\Omega,\mathscr{F},\mathbb{P})$ ，称之为概率空间。这个概率空间模拟的是随机丢 $n$ 次骰子这一试验。这个概率空间满足条件：

$\mathbb{P}(\Omega)=1$ 。
$\mathbb{P}(\{\omega\})=1/|\Omega|$ 。
对于不交的事件 $A, B$ ， $\mathbb{P}(A\cup B)=\mathbb{P}(A)+\mathbb{P}(B)$ 。

不难看出，条件2是不必要的，因为对于一般的概率模型，不同样本的概率很可能不同。这个例子告诉我们，对于任何有限集合，我们都可以在其幂集上定义一个满足条件1，2，3的一致概率（面积/测度）。但接下来这个例子告诉我们，当一个集合被赋予满足条件1和3的概率后，存在一些子集关于这个概率是病态的，因此我们不应该给所有的子集都赋予概率。

考虑掷无穷多次硬币，硬币正面记为 $1$ ，反面记为 $0$ 。则可能的输出结果为 $(\delta_1,\cdots,\delta_n,\cdots)$ ，其中 $\delta_j\in \{0,1\}$ 。定义映射
$\Phi:(0,1]\rightarrow \mathbb{R}^\mathbb{N}, x\mapsto \mathrm{Binary}(x)$
其中 $\mathrm{Binary}(x)$ 表示 $x$ 的二进制，由于有一些数会产生两种二进制，比如 $\frac{1}{2}=0.011\cdots=0.100\cdots$ ，我们取有无穷多个 $1$ 的表示，即 $\mathrm{Binary}(\frac{1}{2})=0.011\cdots$ 。不难看出， $\Phi$ 是单射，且 $\Phi$ 的像加上 $(0,0,\cdots)$ 就是所有可能的输出结果，因此样本空间 $\Omega=\mathrm{Im}\,\Phi\cup (0,0,\cdots)$ ，根据 $\Phi$ 的对应关系，我们可以将样本空间看成 $\Omega=\{0\}\cup(0,1]$ 。假设我们在 $2^\Omega$ 上给出了满足条件1，3的一致概率 $\mathbb{P}$ ，则任何一个样本的概率是 $0$ ，否则根据条件3得到全空间 $\Omega$ 的概率为 $\infty$ 。因此我们得到条件：

对于不可数个不交的事件，概率不能满足可加性。

根据条件3和概率的一致性，我们得到对于二分区间和其可数个二分区间子集， $\mathbb{P}$ 满足可数可加性。因此我们加强条件3为

对于可数个不交事件 $A_1,\cdots,A_n,\cdots$ ， $\mathbb{P}(\bigcup_{i=1}^\infty A_i)=\sum_{i=1}^\infty\mathbb{P}(A_i)$ 。

注：条件5实际上是个很奇怪的条件，因为我们不能通过已有的条件1，3，4推出条件5。然而我们已经推出了对于二分区间条件5成立，因此其又是一个自然的条件。事实上，关于应该选择可数可加性(CA)还是有限可加性(FA)仍是众说纷纭的问题，反对使用CA的数学家有De Finetti，Savage等。1983年出版的《Theory of Charges: A Study of Finitely Additive Measures》就是研究FA的数学理论，感兴趣的读者可阅读这篇19年的文章。

现在我们总结出我们对概率的几条期望，这些期望通常被称为概率公理：对于样本空间 $\Omega$ 和事件域 $\mathscr{F}\subset 2^{\Omega}$ ，概率为 $\mathbb{P}:\mathscr{F}\rightarrow [0,1]$ 且满足如下条件：

$\mathbb{P}(\Omega)=1$ 且 $\mathbb{P}(\empty)=0$ 。
对于可数个不交事件 $A_1,\cdots,A_n,\cdots\in \mathscr{F}$ ， $\mathbb{P}(\bigcup_{i=1}^\infty A_i)=\sum_{i=1}^\infty\mathbb{P}(A_i)$ 。

概率公理1和2回答了问题b，只有满足概率公理1和2的函数，才能被称为概率。而问题a的等价形式是事件域 $\mathscr{F}$ 是否是 $2^\Omega$ ，答案是否定的，对于满足概率公理1和2的概率， $\mathscr{F}$ 不一定是 $2^\Omega$ 。我们假设 $\Omega=[0,1]$ ， $\mathbb{P}$ 是 $2^\Omega$ 上平移不变的概率（平移不变的概率是否存在现在还不知道，我们以后将构造一个平移不变的概率——Lebesgue测度），根据选择公理（Axiom of Choice），我们可以从集合 $S=[\frac{1}{3},\frac{2}{3}]/\mathbb{Q}$ 的每个元素 $[x]$ 中取出一个代表元 $x$ ，所有这样的 $x$ 构成一个集合 $V$ ， $V\subset [\frac{1}{3},\frac{2}{3}]$ ， $V$ 满足如下条件：