第四章-随机变量的概念

最新推荐文章于 2024-06-23 18:05:36 发布

MadJieJie

最新推荐文章于 2024-06-23 18:05:36 发布

阅读量491

点赞数

分类专栏： Fundamentals of maths 文章标签：概率论

若有帮助，请点赞&收藏，转载请标注出处。

本文链接：https://blog.csdn.net/madjiejie/article/details/120945274

版权

Fundamentals of maths 专栏收录该内容

8 篇文章 3 订阅

订阅专栏

文章目录

4.1 引言
- 4.1.1 随机变量
4.2 分布函数和密度函数

4.1 引言

4.1.1 随机变量

通俗定义

随机变量是赋予实验的每一个结果 $\xi$ 。这个数字可以是机会游戏中的收益，随机电源中的电压。

给定一个实验，实验的空间为 $S$ ， $S$ 的子集构成的域称作事件，并赋予这些事件以概率。对于实验的每个结果 $\xi$ 都指定一个数 $\bm{x}(\xi)$ 。则构建了一个定义在集合 $S$ 上的函数 $\bm{x}$ ，它的值域为一个数集。若函数 $\bm{x}$ 满足某些不太苛刻的条件，则称函数 $\bm{x}$ 为随机变量。

用随机变量表示事件

重要问题：随机变量 $\bf{x}$ 小于给定的数 $x$ ，或处于数 $x_1$ 和 $x_2$ 之间的概率是多少？例如，若随机变量是身高，我们想得出某些界限的概率。下面，从符号的角度来陈述。
$\{\bm{x} \leq x \}$ 该符号表示 $S$ 的一个子集，由满足 $\bm{x}(\xi) \leq x$ 的所有结果构成。
通过下表的例子说明它的详细含义：给定任意 $x$ ，所有不大于或等于 $x$ 的数 $\bm{x}(\xi)$ 构成，即， $\{\bm{x} \leq 35 \} = \{ 10,20,30 \},$ 即当 $i = 1, 2, 3$ 时， $\bm{x}(f_i) \leq 35$ 。

$\xi$	$\bm{x}(\xi)$
$f_1$	$10$
$f_2$	$20$
$f_3$	$30$
$f_4$	$40$
$f_5$	$50$
$f_6$	$60$

同样地， $\{ x_1 \leq \bm{x} \leq x_2 \},$ 也表示 $S$ 的一个子集，它由所有满足 $x_1 \leq \bm{x} \leq x_2$ 的结果 $\xi$ 构成。

而符号 $\{ \bm{x} = x \},$ 是满足 $\bm{x}(\xi) = x$ 的 $S$ 的子集。

给定 $R$ 是 $x$ 轴上的实数集合，则
$\{x \in R \},$ 表示满足 $\bm{x}(\xi) \in R$ 的 $\xi$ 构成的 $S$ 的子集。

具体定义

随机变量 $\bm{x}$ 是对每个结果 $\xi$ 指定一个数 $\bm{x}(\xi)$ 的过程。产生的函数需满足：

对每个 $x$ ，集合 $\{\bm{x} \leq x\}$ 是一个事件。
事件 $\{x=\infty\}$ 和事件 $\{x=-\infty\}$ 的概率等于零。即
$P\{x=\infty\} = 0 , \quad P\{x=-\infty\} = 0 .$
第二个条件表明，一些结果随允许 $x$ 取 $\infty$ 或 $-\infty$ ，但要求这些结果构成的集合为零概率。

注意：一个复随机变量 $z$ 为
$\bm{z} = \bm{x} + j \bm{y},$
式中 $\bm{x}$ 和 $\bm{y}$ 都是实随机变量。

4.2 分布函数和密度函数

在集合 $S$ 中，组成事件 $\{\mathbf{x} \leq x \}$ 的元素随 $x$ 取值不同而变化。因此，事件 $\{\bm{x} \leq x\}$ 的概率 $P\{\bm{x} \leq x\}$ 是依赖于 $x$ 的一个数。这个数表示为 $F_x(x)$ ，并称它为随机变量 $\bm{x}$ 的(累积)分布函数。

定义

随机变量 $\bm{x}$ 的分布函数
$F_x(x) = P\{\bm{x} \leq x\}$ 是定义在从 $-\infty$ 到 $\infty$ 上的函数。

通常来说，随机变量 $\bm{x}$ , $\bm{y}$ 和 $\bm{z}$ 分别用 $F_x(x)$ 、 $F_y(y)$ 和 $F_z(z)$ 来表示。

例子 4-3 在抛硬币实验中，定义正面 $(h)$ 的概率为 $p$ ，反面 $(t)$ 概率为 $q$ ，我们定义 $\bm{x}$ 满足
$\bm{x}(h) = 1,~~ \bm{x}(t) = 0,$ 求该随机变量的分布函数F(x)，其中 $x\in (-\infty,\infty)$ 。
如下图所示：

若 $\geq 1$ ，则 $\bm{x}(h)=1 \leq x$ ， $\bm{x}(t)=0 \leq x$ 。因此，
$P\{\bm{x} \leq x \}=P\{ h, t \} = p + q = 1, \quad x \geq 1.$
若 $\leq x <1$ ，则 $\bm{x}(h)=1 > x$ ， $\bm{x}(t)=0 \leq x$ 。因此，
$P\{\bm{x} \leq x \}=P\{ h, t \} = q , \quad 0 \leq x <1.$
若 $x < 0$ ，则 $\bm{x}(h)=1 > x$ ， $\bm{x}(t)=0 > x$ 。因此，
$P\{\bm{x} \leq x \}=P\{ \empty \} = 0 , \quad x >0.$

在这里插入图片描述
例子 4-4 在抛色子中，设随机变量 $\bm{x}(f_i) = 10i$ 。若骰子均匀的，则 $\bm{x}$ 的分布函数是下图所示的阶梯函数。

$P\{\bm{x} \leq 100\} = P\{S\} = 1$
$P\{\bm{x} \leq 35\} = P\{f_1,f_2,f_3\} = \frac{3}{6}$

在这里插入图片描述
注意：复随机变量 $\bm{z} = \bm{x} + j\bm{y}$ 没有分布函数，因为 $\bm{x} + j\bm{y} \leq x + jy$ 是没有意义。

分位点

一个随机变量 $\bm{x}$ 的 $u$ 分位点是满足 $u=P\{ \bm{x} \leq x_u \} = F(x_u),$ 的最小的实数 $x_u$ 。
因此， $x_u$ 可以看作函数 $u = F (x)$ 的逆函数。这个函数的值域是 $\leq u \leq 1$ ，函数取值范围是 $x$ 轴。

4.2.1 分布函数的性质

在下面，表示式 $F(x^+)$ 和 $F(x^-)$ 分别表示函数 $F (x)$ 在 $x$ 点的右极限和左极限，即，
$F(x^+) = \lim F(x+\varepsilon), \quad F(x^-) = \lim F(x - \varepsilon)， 0< \varepsilon \rightarrow 0.$

分布函数具有以下的性质：

$F(+\infty) =1 \quad F(-\infty) =0$
证 $F(+\infty) = P\{ \bm{x} \leq +\infty \} = P\{S\} = 1$ $F(-\infty) = P\{ \bm{x} \leq -\infty \} = P\{\empty\} = 0$
它是 $x$ 的非降函数，即 $x_1<x_2,\quad 则有F(x_1) \leq F(x_2).$
如果 $F(x_0) = 0$ ，则对于 $\leq x_0$ ， $F (x) = 0$
$P\{\bm{x}>x\} = 1 - F(x)$
函数 $F (x)$ 是右连续的，即 $F(x^+) = F(x)$
$P\{x_1 < \bm{x} \leq x_2\} = F(x_2)-F(x_1)$
$P\{\bm{x} = x\} = F(x) - F(x^-)$
$P\{ x_1 \leq \bm{x} \leq x_2 \} = F(x_2) - F(x^-_1)$

注意：在分布函数的不连续点（间断点），左右极限是不相等的，从性质7中， $P\{ \bm{x}(\xi) = x_0 \} = F_x(x_0) - F_x(x_0^-) >0,$ 若一个分布函数只有跳跃型的间断点，则上式成立。

例子4-8 假定随机变量 $\bm{x}$ 满足：如果 $\xi \in A, ~\bm{x}(\xi) = 1$ ;否则， $\bm{x}(\xi) = 0$ 。求分布函数 $F (x)$ 。
解：

对于 $x < 0$ ， $\{\bm{x}(\xi) \leq x \} =\{\empty\}$ ，所以 $F (x) = 0$ ；
对于 $\leq x <1$ ， $\{ \bm{x}(\xi) \leq x \} = \{ \bar{A}\}$ ，所以 $F (x) = 1 - p = q$ ，其中 $\equiv P(A)$ ；
对于 $\leq 1$ ， $\{ \bm{x}(\xi) \leq x \} = \{ \Omega \}$ ，所以 $F (x) = 1$ 。

这里事件 $A$ 可对应于试验成功，而事件 $\bar{A}$ 对应于试验失败。

4.2.2 连续型，离散型和混合型随机变量

如果随机变量 $\bm{x}$ 的分布函数 $F_x(x)$ 是连续的，则称 $\bm{x}$ 是连续型随机变量。在这种情况下， $F_x(x^-)=F_x(x)$ ， $P\{\bm{x}=x\} = 0$ 。
若 $F_x(x)$ 是仅有有限多个跳跃型间断点的阶梯函数， $\bm{x}$ 被称为离散型随机变量。如果如果 $x_i$ 是间断点，则 $P\{\bm{x}=x_i\} = F_x(x_i) - F_x(x_i^-)=p_i.$
例如，可得到在间断点 $a$ ， $P\{\bm{x} = a\}=F_x(a)-F_x(a^-) = 1-0 = 1.$
例如，可得到在间断点 $0$ ， $P\{\bm{x} = 0\}=F_x(0)-F_x(0^-) = q-0 = q.$

例4-9 掷一枚均匀硬币两次，设随机变量 $\bm{x}$ 表示正面 $h$ 出现的次数。求分布函数 $F_x(x)$ 。
解
$\Omega=\{ hh,ht,th, tt \}$ ，并且 $\bm{x}(hh)=2,~\bm{x}(ht)=1,~\bm{x}(th)=1,~\bm{x}(tt)=0.$ 对 $x < 0$ ， $\{\bm{x}(\xi) \leq x\} = \{\empty\} \rightarrow F_x(x) = 0$ ;
对 $\leq x < 1$ ， $\{\bm{x}(\xi) \leq x\} = \{ tt \} \rightarrow F_x(x) = P\{t\} P\{t\} = \frac{1}{4}$ ;
对 $\leq x < 2$ ， $\{\bm{x}(\xi) \leq x\} = \{ ht, th, tt \} \rightarrow F_x(x) = P\{ht\} + P\{th\} + P\{tt\} = \frac{3}{4}$ ;
对 $\geq 2$ ， $\{\bm{x}(\xi) \leq x\} =\Omega = \{ hh, ht, th, tt \} \rightarrow F_x(x) = P\{hh\} + P\{ht\} + P\{th\} + P\{tt\} = 1$ 。

4.2.3 概率密度函数（p. d. f）

一个随机变量 $\bm{x}$ 的分布函数 $F (x)$ 的导数称为 $\bm{x}$ 的概率密度函数，记为， $f_x(x)$ ， $f_x(x) \equiv \frac{\text{d} F_x(x)}{\text{d} x}.$
从分布函数 $F_x(x)$ 的单调非减性，概率密度函数满足： $\forall x \in (-\infty,\infty)$ $\lim_{\triangle x \rightarrow 0} \frac{F_x(x + \triangle x) - F_x(x)}{\triangle } \geq 0 ,$ 如果 $\bm{x}$ 是一个连续随机变量， $f_x(x)$ 将是一个连续函数。

如果 $\bm{x}$ 是一个离散型随机变量，它的概率密度函数具有下面的一般形式： $f_x(x)=\sum_i p_i \delta(x-x_i)，$ 这里的 $x_i$ 表示分布函数的间断点。

从前式可得出分布函数： $F_x(x) = \int_{-\infty}^{x} f_x(u) \text{d} x.$

因为 $F_x(+\infty) = 1$ ，从上式可得 $\int_{-\infty}^{\infty} f_x(x) \text{d} x = 1$

$P\{x_1 < \bm{x}(\xi) \leq x_2\} = F_x(x_2) - F_x(x_1) = \int_{x_1}^{x_2} f_x(x) \text{d} x,$ 因此，在区间 $x_1,x_2)$ 上， $f_x(x)$ 下的面积正好等于随机变量 $\bm{x}$ 落在区间 $x_1,x_2)$ 内的概率，如下图所示：
在这里插入图片描述注意：如果随机变量 $\bm{x}$ 是连续型的，则上式的区间可用左右都为闭区间的形式，i.e., $x_1,x_2]$ 。而如果为 $x_1, x_2$ 为间断点，则积分必须包括 $f (x)$ 在相应端点处的脉冲。

当 $x_1=x,x_2 = x + \triangle x$ ，从上式可得出以下结论：
如果 $\bm{x}$ 是连续型的，则，只要 $\triangle x$ 足够小， $P\{x \leq \bm{x} \leq x+\triangle x\} \approx f(x) \triangle x,$ $\lim_{\triangle x \rightarrow 0 } \frac{P\{ x\leq \bm{x} \leq x +\triangle x \} }{\triangle x}.$