概率论与数理统计 | 知识点总结（上）

CHH3213

已于 2022-09-21 19:01:06 修改

阅读量830

点赞数 4

分类专栏：数学文章标签：概率论

于 2022-08-23 15:25:06 首次发布

本文链接：https://blog.csdn.net/weixin_42301220/article/details/126478226

版权

数学专栏收录该内容

16 篇文章 20 订阅

订阅专栏

参考资料

概率论 · 复习概要
何书元《概率论与数理统计》

1. 随机事件与概率

1.1 古典概型

古典概型中常用计数一有重复的排列数

从 $n$ 个不同元素中有放回地每次随机抽取一个, 共抽取 $m$ 次, 有序地记录结果, 共有 $n^{m}$ 种等可能的不同结果。
例：掷骰子 3 次, 记录每次结果, 结果一共有 $\times 6 \times 6=6^{3}$ 种。
例：从 52 张扑克牌中随机有放回地抽取并记录 3 次, 结果共有 $52^{3}$ 种。

古典概型中常用计数一排列数

从 $n$ 个不同元素中无放回地每次随机抽取一个, 共抽取 $m$ 次 $\leq n)$ , 有序地记录结果, 共有
$A_{n}^{m}=n(n-1) \ldots(n-m+1)=\frac{n !}{(n-m) !}$
种等可能的不同结果。
$A_{n}^{m}$ 在有的教材中记为 $P_{n}^{m}$ 。
例：从 52 张扑克牌中随机无放回地抽取 3 张, 记录每次结果, 结果有 $52 \times 51 \times 50=A_{52}^{3}$ 种。

古典概型中常用计数一组合数

从 $n$ 个不同元素中无放回地每次抽取一个, 共抽取 $m$ 次 $\leq n)$ , 不计次序地记录结果 (只要元素相同, 不管次序是否相同都算是相同结果), 共有
$C_{n}^{m}=\frac{n(n-1) \ldots(n-m+1)}{m !}=\frac{n !}{m !(n-m) !}$
种等可能的不同结果。
例：从一副扑克牌的 4 张 A 中随机无放回抽取 2 张组成一手牌, 不计次序。有 $C_{4}^{2}=4 \times 3 / 2=6$ 种结果。

古典概型中常用计数一分组方式数

将 $n$ 个不同元素分成有序号的 $k$ 组, 要求第 $i$ 组恰好有 $n_{i}$ 个元素 $\ldots, k)$ , 分组结果中同组的元素不考虑次序。则这样分组的所有不同分法个数为
$\left(\begin{array}{c} n \\ n_{1}, n_{2}, \ldots, n_{k} \end{array}\right)=\frac{n !}{n_{1} ! n_{2} ! \ldots n_{k} !} .$
当随机分组时, 这些分法是等可能的。
随机分组的方法是 $n$ 个元素随机排列 ( $n$ ! 种排法), 然后前 $n_{1}$ 个不计次序地归入 $i = 1$ 组, 后续 $n_{2}$ 个不计次序地归入 $i = 2$ 组, 以此类推。
例 10 个学生分成 $\mathrm{A}, \mathrm{B}, \mathrm{C}$ 三个组, 分别有 3、3、4人, 组内不计次序。
分组方式个数为
$\frac{10 !}{3 ! 3 ! 4 !} \triangleq\left(\begin{array}{c} 10 \\ 3,3,4 \end{array}\right)$

古典概型中常用计数一可重复分组数

从 $n$ 个不同的球中有放回地每次抽取一个, 共抽取 $m$ 次, 结果不计次序。共有 $C_{n+m-1}^{m}$ 种不同的组合。
用 0 和 1 组成的序列表示一个结果。
用 $n - 1$ 个 1 分隔出 $n$ 个组, 1 表示组边界。这 $n$ 个组是结果排序后球号 $\ldots, n$ 的组。
每组内有若干个 0 表示该组个数, 如果出现 11 则该组没有球, 把 $m$ 个 0 分配到各个组中。
这样, 用长度为 $n + m - 1$ 的 0-1 向量表示一个结果, 结果个数为 $C_{n+m-1}^{n-1}$ (从 $n + m - 1$ 个二进制位中选择 1 的位置, 即边界的位置)。
可重复分组数在随机分组时一般不是等可能的。
例如, 从红、白两个球中有放回地抽取 2 次, 计数这 2 次红球、白球个数。共有 (红 0 , 白 2 $), ($ 红 1 , 白 1 $), ($ 红 2 , 白 0 $)$ 三种结果, 即 $C_{2+2-1}^{2}=3$ 种结果。随机抽取时 (红 1 , 白 1) 概率为 $\frac{1}{2}$ , (红 0 , 白 2) 和 (红 2 , 白 $0)$ 的概率都是 $\frac{1}{4}$ 。

例题

1.2 加法公式与乘法公式

和事件的概率 $\cup B)$ 在不同场合下的求法:

一般形式:
$\begin{aligned} P(A \cup B) &=P(A)+P(B)-P(A B) \\ P(A \cup B \cup C) &=P(A)+P(B)+P(C)-P(A B)-P(A C)-P(B C)+P(A B C) . \end{aligned}$
若 $A, B$ 互不相容: $\cup B)=P(A)+P(B)$ .
若 $A, B$ 相互独立:
$\begin{aligned} P(A \cup B) &=1-P(\overline{A \cup B})=1-P(\bar{A} \bar{B}) \\ &=1-P(\bar{A}) P(\bar{B}) \end{aligned}$

积事件的概率 $P (A B)$ 的求法:

一般形式:
$\mid A)=P(B) P(A \mid B) .$
若 $A, B$ 相互独立:
$P (A B) = P (A) P (B) .$
乘法公式来自于条件概率公式:
$\mid A)=\frac{P(A B)}{P(A)}$

1.3 全概率公式和 Bayes 公式

全概率公式
$\begin{aligned} P(A) &=P\left(A B_{1}\right)+P\left(A B_{2}\right)+\cdots+P\left(A B_{n}\right) \\ &=P\left(B_{1}\right) P\left(A \mid B_{1}\right)+P\left(B_{2}\right) P\left(A \mid B_{2}\right)+\cdots+P\left(B_{n}\right) P\left(A \mid B_{n}\right) . \end{aligned}$
Bayes 公式
$P\left(B_{i} \mid A\right)=\frac{P\left(B_{i}\right) P\left(A \mid B_{i}\right)}{\sum_{j=1}^{n} P\left(B_{j}\right) P\left(A \mid B_{j}\right)}, \quad i=1,2, \cdots, n .$
Bayes 公式本质上是条件概率公式:
$P\left(B_{i} \mid A\right)=\frac{P\left(A B_{i}\right)}{P(A)},$
只是其分子、分母进一步分别使用了乘法公式和全概率公式.

全概率公式表达了 “综合考虑引起结果 $A$ 的各种原因 $B_{i}$ , 计算导致结果 $A$ 出现的可能性的大小”; 如果一个事件的发生有多个 “诱因”, 就要用到全概率公式.
Bayes 公式则反映了 “当结果 $A$ 出现时, 它是由原因 $B_{i}$ 引起的可能性的大小”. Bayes 公式常用来追究责任, 或者 “执果索因”. 也就是计算各个 “诱因” 对事件发生的 “贡献”.

例题：

发报台分别以概率0.6和0.4发出信号“1”和“0”。由于通讯系统受到干扰，当发出信号“1”时，收报台未必收到信号“1”，而是分别以概率0.8和0.2收到信号“1”和“0”；同时，当发出信号“0”时，收报台分别以概率0.9和0.1收到信号“0”和“1”。求（1）收报台收到信号“1”的概率；（2）当收报台收到信号“1”时，发报台确是发出信号“1”的概率。

正确答案：

设A1=“发出信号1”，A0=“发出信号0”，A=“收到信号1”

(1)由全概率公式，有P(A)=P(A|A1)P(A1)+P(A|A0)P(A0)=0.8x0.6+0.1x0.4=0.52

(2)由贝叶斯公式，有P(A1|A)=P(A|A1)P(A1)/P(A)=0.8x0.6/0.52=12/13

2. 随机变量及其概率分布

2.0 密度函数与分布函数

概率密度函数定义

设 $X$ 是随机变量, 如果存在非负函数 $f (x)$ 使得对任何满足 $-\infty \leq a<b \leq \infty$ 的 $a, b$ , 有
$\leq b)=\int_{a}^{b} f(x) d x,$
就称 $X$ 是连续型随机变量, 称 $f (x)$ 是 $X$ 的概率密度函数, 简称为概率密度 (probability density) 或密度.

分布密度性质

设 $f (x)$ 是 $X$ 的概率密度, 则 $f (x)$ 有如下的基本性质.
(a) $\int_{-\infty}^{\infty} f(x) d x=1$ ,
(b) $P (X = a) = 0$ . 于是 $\leq b)=P(a \leq X \leq b)$ ,
证明: (a) 由
$\int_{-\infty}^{\infty} f(x) d x=P(-\infty<X \leq \infty)=1$
可得。
(b)
$\operatorname{Pr}(X=a) \leq \operatorname{Pr}(X \in(a-\varepsilon, a])=\int_{a-\varepsilon}^{a} f(x) d x \rightarrow 0, \quad \varepsilon \rightarrow 0 .$

概率分布函数定义

对随机变量 $X$ , 称 $x$ 的函数
$\leq x), \quad-\infty \leq x \leq \infty,$
为 $X$ 的概率分布函数, 简称为分布函数 (distribution function), 也称为累积 (cumulative) 分布函数。
例: $\Phi(x)=\int_{-\infty}^{x} \varphi(t) d t$ 是标准正态分布的分布函数.

离散型随机变量的分布函数

从定义看出, 如果 $X$ 是离散型随机变量, 有概率分布
$p_{k}=P\left(X=x_{k}\right), k=1,2, \cdots,$
则 $X$ 的分布函数
$\leq x)=P\left(\bigcup_{j: x_{j} \leq x}\left\{X=x_{j}\right\}\right)=\sum_{j: x_{j} \leq x} p_{j}$
是单调不减的阶梯函数.

连续型随机变量的分布函数

如果 $X$ 是连续型随机变量, 有概率密度 $f (x)$ , 则
$F(x)=\int_{-\infty}^{x} f(t) d t$
是连续函数, 并且在 $f (x)$ 的连续点 $x$ 有 $f(x)=F^{\prime}(x)$ . 我们称 $F (x)$ 是 $f (x)$ 的分布函数.

分布函数性质

分布函数 $F (x)$ 的常用性质:
(1) $F$ 单调不减右连续,
(2) $F(\infty)=1, F(-\infty)=0$ .

证明

(1) 对 $x < y$ , 单调不减性由
$\{x<X \leq y\}=\{X \leq y\}-\{X \leq x\}$
和 $\leq y)=P(X \leq y)-P(X \leq x)=F(y)-F(x) \geq 0$ 得到.
由于 $n$ 越大, 集合 $\{X \leq x+1 / n\}$ 越小, 所以用 $F$ 的单调性和概率 $P$ 的连续性得到
$\begin{aligned} \lim _{\delta \downarrow 0} F(x+\delta) &=\lim _{n \rightarrow \infty} F(x+1 / n) \\ &=\lim _{n \rightarrow \infty} P(X \leq x+1 / n) \\ &=P\left(\cap_{n=1}^{\infty}\{X \leq x+1 / n\}\right) \\ &=P(X \leq x)=F(x) . \end{aligned}$
(2) 由 $F(\infty)=P(X \leq \infty)=P(\Omega)=1$ 和 $F(-\infty)=P(X \leq-\infty)=$ $P(\emptyset)=0$ 得到 (2).

2.1 已知密度函数 $f (x)$ , 求分布函数 $F (x)$

密度函数 $f (x)$ 一般是分段函数. 由 $f (x)$ 求 $F (x)$ , 本质上是分段函数求积分的问题!

典型例题:
设随机变量 $X$ 具有概率密度
$\begin{cases}k x, & 0 \leqslant x<3, \\ 2-\frac{x}{2}, & 3 \leqslant x \leqslant 4, \\ 0, & \text { 其它. }\end{cases}$
(1) 确定常数 $k$ ; (2) 求 $X$ 的分布函数 $F (x)$ ; (3) 求 $P\{1<X \leqslant 3.5\}$ .

解

(1) 由 $\int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1$ , 得
$\int_{0}^{3} k x \mathrm{~d} x+\int_{3}^{4}\left(2-\frac{x}{2}\right) \mathrm{d} x=1,$
解得 $k=\frac{1}{6}$ .

(2) 对 $F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t$ ,

$x < 0$ 时, $F(x)=\int_{-\infty}^{x} f(t) \mathrm{d} t=\int_{-\infty}^{x} 0 \mathrm{~d} t=0$ .
$\leqslant x<3$ 时, $F(x)=\int_{-\infty}^{0} 0 \mathrm{~d} t+\int_{0}^{x} \frac{t}{6} \mathrm{~d} t=\frac{x^{2}}{12}$ .
$\leqslant x<4$ 时,
$\begin{aligned} F(x) &=\int_{-\infty}^{0} 0 \mathrm{~d} t+\int_{0}^{3} \frac{t}{6} \mathrm{~d} t+\int_{3}^{x}\left(2-\frac{t}{2}\right) \mathrm{d} t \\ &=-3+2 x-\frac{x^{2}}{4} \end{aligned}$
$\geqslant 4$ 时, $F (x) = 1$ .
即
$\begin{cases}0, & x<0 \\ \frac{x^{2}}{12}, & 0 \leqslant x<3 \\ -3+2 x-\frac{x^{2}}{4}, & 3 \leqslant x<4, \\ 1, & x \geqslant 4\end{cases}$
做完一定要验算: $F^{\prime}(x)=f(x)$ .

(3) $P\{1<x \leqslant 3.5\}=F(3.5)-F(1)=41 / 48$ .

2.2 随机变量的函数

已知连续型随机变量 $X$ 的概率密度 $f_{X}(x)$ , 求随机变量 $Y = g (X)$ 的概率密度 $f_{Y}(y)$ , 两种方法:

分布函数微分法
已知随机变量 $X$ 具有概率密度
$f_{X}(x)= \begin{cases}f(x), & a<x<b, \\ 0, & \text { 其他. }\end{cases}$
对随机变量 $Y = g (X)$ , 要求 $f_{Y}(y)$ . 则对函数关系 $y = g (x)$ , 给出反函数 $x = h (y)$ , 有
$f_{Y}(y)= \begin{cases}f(h(y)) \cdot\left|h^{\prime}(y)\right|, & a<h(y)<b, \\ 0, & \text { 其他. }\end{cases}$
其中函数 $y = g (x)$ 处处可导且单调.
积分转化法.

典型例题:
设随机变量 $X$ 具有概率密度
$f_{X}(x)= \begin{cases}\frac{x}{8}, & 0<x<4, \\ 0, & \text { 其他. }\end{cases}$
求 $Y = 2 X + 8$ 的概率密度 $f_{Y}(y)$ .

解先求 $Y$ 的分布函数. (请自已注明下述各个步骤的理由.)
$\begin{aligned} F_{Y}(y) &=P\{Y \leqslant y\} \\ &=P\{2 X+8 \leqslant y\} \\ &=P\left\{X \leqslant \frac{y-8}{2}\right\} \\ &=\int_{-\infty}^{\frac{y-8}{2}} f_{X}(x) \mathrm{d} x \end{aligned}$
注意到积分上限函数求导法则 $\left(\int_{-\infty}^{\varphi(x)} f(x) \mathrm{d} x\right)^{\prime}=f(\varphi(x)) \varphi^{\prime}(x)$ , 上式两端关于 $y$ 求导, 得
$\begin{aligned} f_{Y}(y) &=f_{X}\left(\frac{y-8}{2}\right) \cdot\left(\frac{y-8}{2}\right)_{y}^{\prime} \\ &=\frac{1}{2} f_{X}\left(\frac{y-8}{2}\right) \\ &= \begin{cases}\frac{1}{2} \cdot \frac{y-8}{2}, & 0<\frac{y-8}{2}<4, \\ 0, & \text { 其他. }\end{cases} \\ &= \begin{cases}\frac{y-8}{32}, & 8<y<16, \\ 0, & \text { 其他. }\end{cases} \end{aligned}$
上述方法体现为下面的一般结论. 称为单调函数公式法:

2.3 正态分布

正态分布的标准化: 若 $\sim N\left(\mu, \sigma^{2}\right)$ , 则 $\frac{X-\mu}{\sigma} \sim N(0,1)$ .
对一般的随机变量也可以 “标准化”, 即使它不一定服从正态分布. 事实上, $X$ 标准化变量为
$X^{*}=\frac{X-E(X)}{\sqrt{D(X)}},$
则
$E\left(X^{*}\right)=0, \quad D\left(X^{*}\right)=1 .$
正态分布的再生性: 设 $X, Y$ 相互独立, $\sim N\left(\mu_{1}, \sigma_{1}^{2}\right), Y \sim N\left(\mu_{2}, \sigma_{2}^{2}\right)$ , 则
$\begin{gathered} X+Y \sim N\left(\mu_{1}+\mu_{2}, \sigma_{1}^{2}+\sigma_{2}^{2}\right) \\ a X \pm b Y \sim N\left(a \mu_{1} \pm b \mu_{2}, a^{2} \sigma_{1}^{2}+b^{2} \sigma_{2}^{2}\right) . \end{gathered}$
$\Phi(-x)=1-\Phi(x)$ .
$z_{1-\alpha}=-z_{\alpha}$ .

2.4 常用的概率分布表

3. 多维随机变量及其概率分布

3.1 边缘分布与边缘密度

边缘分布

设 $F (x, y)$ 是 $(X, Y)$ 的联合分布, 则 $X, Y$ 分别有概率分布
$\begin{aligned} &F_{X}(x)=P(X \leq x, Y \leq \infty)=F(x, \infty), \\ &F_{Y}(y)=P(X \leq \infty, Y \leq y)=F(\infty, y) . \end{aligned}$
我们称 $X$ 的分布函数 $F_{X}(x), Y$ 的分布函数 $F_{Y}(x)$ 为 $(X, Y)$ 的边缘分布函数 (marginal distribution function).

边缘密度

设 $f (x, y)$ 是随机向量 $(X, Y)$ 的概率密度, 则 $X$ 和 $Y$ 也都是连续型随机变量, 我们称 $X, Y$ 各自的概率密度为 $f (x, y)$ 或 $(X, Y)$ 的边缘密度 (marginal density).
对任何 $a < b$ , 有
$\begin{aligned} P(a<X \leq b) &=P(a<X \leq b, Y<\infty) \\ &=\int_{a}^{b}\left(\int_{-\infty}^{\infty} f(x, y) d y\right) d x \end{aligned}$
由概率密度的定义知道 $X$ 有边缘密度
$f_{X}(x)=\int_{-\infty}^{\infty} f(x, y) d y .$
完全对称地得到 $Y$ 的边缘函数
$f_{Y}(y)=\int_{-\infty}^{\infty} f(x, y) d x$

联合分布与联合密度

设 $(X, Y)$ 有连续的分布函数 $F (x, y)$ , 定义
$\begin{cases}\frac{\partial^{2} F(x, y)}{\partial x \partial y}, & \text { 当该混合偏导数存在, } \\ 0, & \text { 其他. }\end{cases}$
如果
$\iint_{R^{2}} f(x, y) d x d y=1,$
则 $f (x, y)$ 是 $(X, Y)$ 的联合密度.

独立性的判断, 即看下列式子是否成立:
$\times 边缘.$

联合概率计算的例子

两人某天在 1 点至 2 点间独立地随机到达某地会面, 先到者等候 20 分钟后离去. 求这两人能相遇的概率.
解认为每个人在 0 至 60 分钟内等可能到达, 用 $X, Y$ 分别表示他们的到达时间. 则 $\sim \mathrm{U}(0,60), Y \sim \mathrm{U}(0,60), X, Y$ 独立. 利用
$f_{X}(x)=f_{Y}(x)= \begin{cases}\frac{1}{60}, & x \in(0,60), \\ 0, & x \notin(0,60),\end{cases}$
得到 $(X, Y)$ 的联合密度
$y)=f_{X}(x) f_{Y}(y)= \begin{cases}1 / 60^{2}, & (x, y) \in D, \\ 0, & (x, y) \notin D .\end{cases}$
其中 $D=\{(x, y) \mid 0 \leq x, y \leq 60\}$ .
$A=\{(x, y)|| x-y \mid \leq 20,(x, y) \in D\} .$
要计算的概率是
$\begin{aligned} P(|X-Y| \leq 20) &=\iint_{A} f(x, y) d x d y \\ &=\frac{60^{2}-40^{2}}{60^{2}}=\frac{5}{9} . \end{aligned}$

3.2 随机变量函数的分布

例题

设二维随机变量 $(X, Y)$ 的概率密度为
$\begin{cases}1, & 0<x<1,0<y<2 x, \\ 0, & \text { 其他. }\end{cases}$
求:
(I) $(X, Y)$ 的边缘概率密度 $f_{X}(x), f_{Y}(y)$ ;
(II) $Z = 2 X - Y$ 的概率密度 $f_{Z}(z)$ .

解
(I) 注意到 $f (x, y)$ 在 $X$ -型区域 $\left\{\begin{array}{l}0<y<2 x, \\ 0<x<1\end{array}\right.$ 上有非零表达式, 该区域可以转化为 $Y$ -型区域 $\left\{\begin{array}{l}\frac{y}{2}<x<1, \\ 0<y<2 \text {. }\end{array}\right.$ 则
$\begin{aligned} &f_{X}(x)=\int_{-\infty}^{+\infty} f(x, y) \mathrm{d} y=\left\{\begin{array}{ll} \int_{0}^{2 x} \mathrm{~d} y, & 0<x<1, \\ 0, & \text { 其他. } \end{array}= \begin{cases}2 x, & 0<x<1, \\ 0, & \text { 其他. }\end{cases} \right. \\\\ &f_{Y}(y)=\int_{-\infty}^{+\infty} f(x, y) \mathrm{d} x=\left\{\begin{array}{ll} \int_{\frac{y}{2}}^{1} \mathrm{~d} x, & 0<y<2, \\ 0, & \text { 其他. } \end{array}= \begin{cases}1-\frac{y}{2}, & 0<y<2, \\ 0, & \text { 其他. }\end{cases} \right. \end{aligned}$
(II) 用积分转化法. 此时 $g (x, y) = 2 x - y$ . 对任何有界连续函数 $h (z)$ ,
$\begin{aligned} \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} h[g(x, y)] f(x, y) \mathrm{d} x \mathrm{~d} y &=\int_{0}^{1}\left(\int_{0}^{2 x} h(2 x-y) \cdot 1 \mathrm{~d} y\right) \mathrm{d} x \\ &=\int_{0}^{1}\left(\int_{2 x}^{0} h(z)(-1) \mathrm{d} z\right) \mathrm{d} x \quad(\text { 换元 } z=2 x-y) \\ &=\int_{0}^{1}\left(\int_{0}^{2 x} h(z) \mathrm{d} z\right) \mathrm{d} x \\ &=\int_{0}^{2}\left(h(z) \int_{\frac{z}{2}}^{1} \mathrm{~d} x\right) \mathrm{d} z \quad \text { (交换积分次序) }\\ &=\int_{0}^{2} h(z)\left(1-\frac{z}{2}\right) \mathrm{d} z, \end{aligned}$
得 $Z$ 的概率密度为
$f_{Z}(z)= \begin{cases}1-\frac{z}{2}, & 0<z<2, \\ 0, & \text { 其他. }\end{cases}$

3.3 条件分布和条件密度

条件分布

设 $\boldsymbol{X}=\left(X_{1}, X_{2}, \cdots, X_{n}\right), \boldsymbol{Y}=\left(Y_{1}, Y_{2}, \cdots, Y_{m}\right)$ 是随机向量, 本节讨论已知 $\boldsymbol{X}=\left(x_{1}, x_{2}, \cdots, x_{m}\right)$ 的条件下, $\boldsymbol{Y}$ 的概率分布.
为了叙述的简单, 我们只对 $n = m = 1$ 的情况详细讨论.
离散型随机变量的条件分布
设 $(X, Y)$ 是离散型随机向量, 有概率分布
$p_{i j}=P\left(X=x_{i}, Y=y_{j}\right)>0, \quad i, j=1,2, \cdots,$
$X, Y$ 分别有边缘分布
$p_{i}=P\left(X=x_{i}\right), q_{j}=P\left(Y=y_{j}\right), i, j=1,2, \cdots .$
对每个固定的 $i$ , 由条件概率公式得到条件概率
$P\left(Y=y_{j} \mid X=x_{i}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(X=x_{i}\right)}=\frac{p_{i j}}{p_{i}}, j=1,2, \ldots$
为条件 $X=x_{i}$ 下, $Y$ 的条件概率分布, 简称为条件分布 (conditional distribution).

条件密度

设随机向量 $(X, Y)$ 有联合密度 $f (x, y), X$ 有边缘密度 $f_{X}(x)$ , 若在 $x$ (确定的 $\left.x\right)$ 处 $f_{X}(x)>0$ , 就称
$\leq y \mid X=x)=\int_{-\infty}^{y} \frac{f(x, t)}{f_{X}(x)} d t, y \in \mathbb{R}$
为条件 $X = x$ 下, $Y$ 的条件分布函数 (conditional distribution function), 简称为条件分布, 记做 $F_{Y \mid X}(y \mid x)$ .
称
$f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}, y \in \mathbb{R},$
为条件 $X = x$ 下, $Y$ 的条件概率密度, 简称为条件密度 (conditional density).

4. 随机变量的数字特征

4.1 数学期望

数学期望定义一离散型

定义 $1.1$ 设 $X$ 有概率分布
$p_{j}=P\left(X=x_{j}\right), j=0,1, \cdots,$
只要级数 $\sum_{j=0}^{\infty}\left|x_{j}\right| p_{j}$ 收敛, 就称
$\mathrm{E}(X)=\sum_{j=0}^{\infty} x_{j} p_{j}$
为 $X$ 或分布 $\left\{p_{j}\right\}$ 的数学期望 (expected value) 或均值 (mean).
要求 $\sum_{j=0}^{\infty}\left|x_{j}\right| p_{j}$ 收敛的原因是要使上式中的级数有确切的意义.
当所有的 $x_{j}$ 非负时, 如果上式中的级数是无穷, 由上式定义的 $\mathrm{E}(X)$ 也有明确的意义, 它表明 $X$ 的平均取值是无穷. 这时也称 $X$ 的数学期望是无穷.
不难看出, 只取有限个值的随机变量的数学期望总是存在的.

数学期望定义一连续型

设 $X$ 是有概率密度 $f (x)$ 的随机变量, 如果下式成立,
$\int_{-\infty}^{\infty}|x| f(x) d x<\infty,$
就称
$\int_{-\infty}^{\infty} x f(x) d x$
为 $X$ 或 $f (x)$ 的数学期望或均值.
由于随机变量的数学期望由随机变量的概率分布唯一决定, 所以也可以对概率分布定义数学期望.
概率分布的数学期望就是以它为概率分布的随机变量的数学期望. 有相同分布的随机变量必有相同的数学期望.

期望的计算

计算公式
$\begin{aligned} E(X) &=\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x, \\\\ E(g(X)) &=\int_{-\infty}^{+\infty} g(x) f(x) \mathrm{d} x .\\\\ E(g(X))&=\sum_{k=1}^{\infty} g\left(x_{k}\right) p_{k} \end{aligned}$

数学期望的几个重要性质

设 $C$ 是常数, 则有 $E (C) = C$
设 $\mathrm{X}$ 是随机变量, $\mathrm{C}$ 是常数, 则有 $E (CX) = CE (X)$
设 $\mathrm{X}, \mathrm{Y}$ 是两个随机变量, 则有 $E (X + Y) = E (X) + E (Y)$ ;
设 $X, Y$ 是相互独立的随机变量，则有 $E (X Y) = E (X) E (Y)$

4.2 方差的性质与计算

方差的计算:

$\begin{aligned} D(X) &=E\left[(X-E(X))^{2}\right] \\ &=E\left(X^{2}\right)-(E(X))^{2} . \end{aligned}$

记 $E(X)=\mu$ , 由方差定义式 $D(X)=E\left[(X-\mu)^{2}\right]$ , 可见方差其实是一个期望, 是随机变量函数 $(X-\mu)^{2}$ 的期望. 由随机变量函数期望的求法, 故有
$D(X)=\int_{-\infty}^{+\infty}(x-\mu)^{2} f(x) \mathrm{d} x .$
方差的性质:

$D (C) = 0$ ,
$D (X + C) = D (X)$ .
$D(a X)=a^{2} D(X), D(-X)=D(X)$ .
$\operatorname{Cov}(X, Y)$ .
$X$ 与 $Y$ 不相关 $\Leftrightarrow D(X+Y)=D(X)+D(Y)$ .
$X$ 与 $Y$ 相互独立 $\Longrightarrow D(X+Y)=D(X)+D(Y)$ .
$\pm b Y)=a^{2} D(X)+b^{2} D(Y)$ , 其中 $X$ 与 $Y$ 相互独立.

例题

设随机变量 $X, Y$ 相互独立, 且都服从均值为 0 , 方差为 $\frac{1}{2}$ 的正态分布. 求随机变量 $∣ X - Y ∣$ 的方差,
解令 $Z = X - Y$ . 由题设知, $\sim N(0,1)$ . 对
$\begin{aligned} D(|X-Y|) &=D(|Z|)=E\left(|Z|^{2}\right)-[E(|Z|)]^{2} \\ &=E\left(Z^{2}\right)-[E(|Z|)]^{2} \end{aligned}$
由 $E\left(Z^{2}\right)=D(Z)+[E(Z)]^{2}=1+0=1$ , 且
$\begin{aligned} E(|Z|) &=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{+\infty}|z| \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z=\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty}|z| \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z=\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty} z \mathrm{e}^{-z^{2} / 2} \mathrm{~d} z \\ &=-\frac{2}{\sqrt{2 \pi}} \int_{0}^{+\infty} \mathrm{d}\left(\mathrm{e}^{-z^{2} / 2}\right)=\left.\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-z^{2} / 2}\right|_{0} ^{+\infty} \\ &=\sqrt{\frac{2}{\pi}} \end{aligned}$
故 $D(|X-Y|)=E\left(Z^{2}\right)-[E(|Z|)]^{2}=1-\frac{2}{\pi}$ .

4.3 协方差与相关系数

协方差的计算:
$\begin{aligned} \operatorname{Cov}(X, Y) &=E[(X-E(X))(Y-E(Y))] \\ &=E(X Y)-E(X) E(Y) . \end{aligned}$

相关系数的计算:
$\begin{aligned} \rho_{X Y} &=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} \\ &=\frac{E[(X-E(X))(Y-E(Y))]}{\sqrt{D(X)} \sqrt{D(Y)}} . \end{aligned}$
随机变量的相关系数 $=$ 随机变量 “标准化” 后的协方差. 事实上, $X, Y$ 标准化为
$X^{*}=\frac{X-E(X)}{\sqrt{D(X)}}, \quad Y^{*}=\frac{Y-E(Y)}{\sqrt{D(Y)}},$
则
$\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}=\operatorname{Cov}\left(X^{*}, Y^{*}\right) .$
相关系数的性质

$|\rho| \leqslant 1$ . 其中
- $|\rho|=1 \Longleftrightarrow X$ 与 $Y$ 之间存在线性关系，即存在常数 a， b 使 $P\{Y = a + bX\}=1$ ;
- $\rho=0 \Longleftrightarrow X$ 与 $Y$ 之间不存在线性关系, 或称 $X$ 与 $Y$ 不相关.
  强调: 不相关是 “不线性相关”的简称!
以下命题是等价的:
- $X$ 与 $Y$ 不相关.
- $\rho_{X Y}=0$ .
- $\operatorname{Cov}(X, Y)=0$ .
- $E (X Y) = E (X) E (Y)$ .
- $D (X + Y) = D (X) + D (Y)$ .
$X$ 与 $Y$ 独立 $\Longrightarrow X$ 与 $Y$ 不相关. 反之不一定成立.

4.4 切比雪夫不等式

$P\{|X-E(X)| \geqslant \varepsilon\} \leqslant \frac{D(X)}{\varepsilon^{2}},$
或等价地
$P\{|X-E(X)|<\varepsilon\} \geqslant 1-\frac{D(X)}{\varepsilon^{2}} .$

5. 概率极限定理

中心极限定理即言: 大量独立同分布的随机变量之和, 近似服从正态分布

中心极限定理:

(1) 设随机变量 $X_{1}, X_{2}, \cdots, X_{n}$ 独立同分布, $E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}, k=1,2 \cdots, n$ . 从而,
$E\left(\sum_{k=1}^{n} X_{k}\right)=n \mu, \quad D\left(\sum_{k=1}^{n} X_{k}\right)=n \sigma^{2} .$
则近似地有
$\sum_{k=1}^{n} X_{k} \sim N\left(n \mu, n \sigma^{2}\right),$
上式一般用于求解和的概率问题.

进一步 “标准化” 得
$\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \sim N(0,1) .$
等价地,
$\frac{\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .$
记 $\bar{X}=\frac{1}{n} \sum_{k=1}^{n} X_{k}$ , 则
$\frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) .$
等价地,
$\bar{X} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) .$
也可以直接由 $E\left(X_{k}\right)=\mu, D\left(X_{k}\right)=\sigma^{2}$ , 得 $E(\bar{X})=\mu, D(\bar{X})=\frac{\sigma^{2}}{n}$ .
上式一般用于求解平均值的概率问题.

(2) 设 $n_{A}$ 为 $n$ 重伯努利试验中事件 $A$ 出现的次数, 且 $A$ 在每次实验中发生的概率为 $p$ . 则 $n_{A}$ 服从二项分布 $B (n, p)$ , 从而
$E\left(n_{A}\right)=n p, \quad D\left(n_{A}\right)=n p(1-p) .$
当 $n$ 很大时, $n_{A}$ 的 “标准化” 变量 $\frac{n_{A}-E\left(n_{A}\right)}{\left.\sqrt{D\left(n_{A}\right.}\right)}$ 近似服从正态分布, 即
$\frac{n_{A}-n p}{\sqrt{n p(1-p)}} \sim N(0,1) .$

例题

一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重 50 千克, 标准差为 5 千克. 若用最大载重量为 5 吨的汽车承运, 试利用中心极限定理说明每辆车最多可以装多少箱, 才能保障不超载的概率大于 $0.977$ .

解：

设所求箱数为 $n$ , 每箱的重量记为 $X_{1}, X_{2}, \cdots, X_{n}$ . 由题设可把 $X_{1}, X_{2}, \cdots, X_{n}$ 视为独立同分布随机变量. 又
$E\left(X_{i}\right)=50, \quad D\left(X_{i}\right)=5^{2}, \quad(i=1,2, \cdots, n)$
根据中心极限定理, 有 $\sum_{i=1}^{n} X_{i}$ 近似服从正态分布 $\left(n \cdot 50, n \cdot 5^{2}\right)$ .
问题即求 $n$ 使
$P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\}>0.977 .$
其中
$\begin{aligned} P\left\{\sum_{i=1}^{n} X_{i} \leqslant 5000\right\} &=P\left\{\frac{\sum_{i=1}^{n} X_{i}-50 n}{5 \sqrt{n}} \leqslant \frac{5000-50 n}{5 \sqrt{n}}\right\} \\ & \approx \Phi\left(\frac{1000-10 n}{\sqrt{n}}\right) \end{aligned}$
故
$\Phi\left(\frac{1000-10 n}{\sqrt{n}}\right)>0.977=\Phi(2),$
即
$\frac{1000-10 n}{\sqrt{n}}>2,$
从而 $n < 98.0199$ , 即最多可以装 98 箱.

CHH3213

关注

4
点赞
踩
28

收藏

觉得还不错? 一键收藏
打赏
0
评论
概率论与数理统计 | 知识点总结（上）

古典概型中常用计数一有重复的排列数古典概型中常用计数一排列数古典概型中常用计数一组合数古典概型中常用计数一分组方式数古典概型中常用计数一可重复分组数例题和事件的概率 P(A∪B)P(A \cup B)P(A∪B) 在不同场合下的求法:一般形式:P(A∪B)=P(A)+P(B)−P(AB)P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC).\begin{aligned}P(A \cup B) &=P(A)+P(B)-P(A B) \\P(A \cup B
复制链接

扫一扫