概率统计第二章随机变量及其分布 2021.9.28_在同一个样本空间上可以定义多个随机变量-CSDN博客

本文链接：https://blog.csdn.net/weixin_51134546/article/details/120527037

第二章随机变量及其分布

为了更好的揭示随机现象的规律性并利用数学工具描述其规律，引入随机变量来描述随机试验的不同结果

随机变量的概念

定义

设E是一随机试验，S是它的样本空间，若
$\forall\varepsilon \in S -按一定法则\to\exists 实数X(\varepsilon)$
则称S上的单值实值函数 $X(\varepsilon)$ 为随机变量

随机变量是 $S\to R$ 上的映射，这个映射具有如下的特点：
- 定义域：S
- 随机性：随机变量X的可能取值不止一个，实验前只能预知它的可能取值，但不能预知取哪个值
- 概率特性：X以一定的概率取某个值或某些值
引入随机变量后，用随机变量的等式或不等式表达随机事件
在同一个样本空间可以同时定义多个随机变量
随机变量的函数一般也是随机变量

随机变量的分类

离散型
非离散型——其中一种类型：连续型

2.1 随机变量的分布函数

随机变量的分布函数

定义

设X为随机变量，对每个实数x，随机事件 $X\leq x$ 的概率
$P(X\leq x)$
定义了一个x的实值函数，称为随机变量X的分布函数，记为F(x)，即
$F(x)=P(X\leq x),\ -\infty<x<+\infty$

注意：分布函数的定义域： $-\infty<x<+\infty$

分布函数的性质

（1） $F (x)$ 单调不减
（2） $0\leq F(x)\leq1$ ，且 $\lim\limits_{x \to +\infty}F(x)=1,\lim\limits_{x \to -\infty}F(x)=0$
（3） $F (x)$ 右连续，即 $F(x+0):=\lim\limits_{t \to x +0}F(t)=F(x)$
- 反之，若存在 $-\infty<x<+\infty$ 上的实函数F(x)，满足以上条件1，2，3，则F(X)一定是某随机变量X的分布函数
- 即，1，2，3是F(x)是一个随机变量的分布函数的充要条件
  - 可以这样思考：1规定了概率的非负性
  - 2规定了概率的规范性
  - 3有什么用呢？？？思考（可能是使F(x)同时满足离散型和连续性随机变量的分布吧）
利用分布函数可以计算：
$P(a<x\leq b)=P(X\leq b)-P(X\leq a) \\=F(b)-F(a)$
$P(a\leq x\leq b)=F(b)-F(a-0)$
$P (a < x < b) = F (b - 0) - F (a)$
$P(a\leq x< b)=F(b-0)-F(a-0)$

2.3 离散型随机变量及其概率分布

离散型随机变量的概念

定义

若随机变量X的可能取值是有限多个或无穷可列个，则称X为离散型随机变量

描述离散型随机变量的概率特性常用它的概率分布或分布律，即
$P(X = x_k)=p_k,\ k = 1,2,...$
概率分布的性质：

非负性： $p_k \geq 0 , k = 1,2,...$
规范性： $\sum_{k=1}^{\infty}p_k=1$

离散型随机变量的分布函数

$F(x)=P(X\leq x)（分布函数的定义） \\=P(\cup_{x_k\leq x}(X = x_k)) \\=\sum_{x_k\leq x}P(X = x_k) \\=\sum_{x_k\leq x}p_k \\p_k=P(X= x_k)=F(x_k)-F(x_{k-1})$

F(X)是分段阶梯函数，在X的可能取值 $x_k$ 处发生间断，间断点为第一类跳跃间断点，在间断点处有跃度 $p_k$

离散型随机变量：用概率分布比用分布函数计算概率更方便
一个结论： $\sum_{k = r}^{\infty}C_{k-1}^{r-1}p^r{(1-p)}^{k-r}=1$

证明过程利用幂级数在收敛域内可逐项求导的性质：
$证明：当|x|<1：\sum_{k = 1}^{\infty}x^{k-1}=\frac{1}{1-x} \\ \sum_{k = 2}^{\infty}(k-1)x^{k-2}=\frac{1}{{(1-x)}^2} \\ \sum_{k = 3}^{\infty}(k-1)(k-2)x^{k-3}=\frac{2}{{(1-x)}^3} \\\Rightarrow\sum_{k = 3}^{\infty}C_{k-1}^{2}x^{k-3}=\frac{1}{{(1-x)}^3} \\归纳地：\sum_{k = r}^{\infty}C_{k-1}^{r-1}x^{k-r}=\frac{1}{{(1-x)}^r} \\令x = 1-p\Rightarrow\sum_{k = r}^{\infty}C_{k-1}^{r-1}{(1-p)}^{k-r}=\frac{1}{{(1-(1-p))}^r}=\frac{1}{{p}^r} \\\Rightarrow\sum_{k = r}^{\infty}C_{k-1}^{r-1}p^r{(1-p)}^{k-r}=1$

2.4 常见的离散型随机变量的分布

（1）0-1分布

随机试验只有两个可能的结果
应用：产品是否合格、人口性别统计、系统是否正常、电力消耗是否超负荷……
分布律可以写成：
$P(X=k)=p^k{(1-p)}^{1-k},k=0,1$

（2）二项分布

Bernoulli试验概型

n重Bernoulli试验概型：

将随机试验重复n次
每次试验感兴趣的事件为A（即可看作每次试验有两个可能的结果： $A,\overline{A}$ ）,设 $P(A)=p,\ 0<p<1$
每次试验的结果与其他次试验无关——称为这n次试验是相互独立的

n重Bernoulli试验感兴趣的问题为：

在n次试验中事件A出现k次的概率，记为 $P_n(k)$ 。若 $P (A) = p$ ，则
$P_n(k)=P(X = k)=C_{n}^kp^k{(1-p)}^{n-k},\ k=0,1,...,n$
称X服从参数为n , p的二项分布，记作
$X\sim B(n,p)$

0-1分布是n=1的二项分布
一个启示：小概率事件虽不易发生，但重复次数多了，就成了大概率事件

Poisson定理

设 $\lim\limits_{n \to \infty}np_n=\lambda>0$ ，则对固定的k，
$\lim\limits_{n \to \infty}C_n^kp_n^k{(1-p)}^{n-k}=e^{-\lambda}\frac{{ \lambda}^k}{k!},\ \ k=0,1,2,...$
Possion定理说明：若 $X\sim B(n,p)$ ，则当n较大，p较小，而 $np=\lambda$ 适中，则可以用近似公式：
$C_n^kp^k{(1-p)}^{n-k}\approx e^{-\lambda}\frac{{ \lambda}^k}{k!},\ \ k=0,1,2,...$
在实际计算中，当 $n\geq20, p\leq0.05$ 时，可用上述公式近似计算；而当 $n\geq 100, np \leq 10$ 时, 精度更好

（3）Poisson分布

在Poisson定理中， $e^{-\lambda}\frac{{ \lambda}^k}{k!}>0$ ，
$\sum_{k=0}^{\infty}e^{-\lambda}\frac{{ \lambda}^k}{k!}=e^{-\lambda}\sum_{k=0}^{\infty}\frac{{ \lambda}^k}{k!}\\=e^{-\lambda}(1+\lambda+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+...)=e^{-\lambda}·e^{\lambda}=1 \\（用到了e^{\lambda}的泰勒展开公式）$
由此产生了一种离散型随机变量的概率分布——Poisson分布