概率论与数理统计 Chapter3. 随机变量的数字特征

Espresso Macchiato

于 2022-02-19 15:04:40 发布

阅读量1.1k

点赞数

分类专栏：基础数学文章标签：概率论机器学习人工智能数理统计统计分布

本文链接：https://blog.csdn.net/codename_cys/article/details/123018713

版权

基础数学专栏收录该内容

24 篇文章 5 订阅

订阅专栏

概率论与数理统计 Chapter3. 随机变量的数字特征
- 1. 重要定义 & 定理
- 2. 几种典型分布

1. 重要定义 & 定理

1. 数学期望（均值）

1. 定义

离散变量的数学期望
- 设随机变量X的取值范围为 $a_1, ..., a_n$ ，其对应的概率分布为 $P(X = a_i) = p_i$ ，则X的数学期望 $E (X)$ （或记为 $E X$ ）定义为：
  
  $\sum_{i=1}^n a_i p_i$
无限级数的数学期望
- 设随机变量X的取值范围为 $a_1, a_2, ...$ ，其对应的概率分布为 $P(X = a_i) = p_i$ ，且满足 $\sum_{i=1}^{\infty} |a_i|p_i < \infty$ ，则变量X存在数学期望，且其数学期望表达式与上述离散分布相同，即：
  
  $\sum_{i=1}^{\infty} a_i p_i$
连续变量的数学期望
- 设X有概率密度函数 $f (x)$ ，如果 $\int_{-\infty}^{\infty} |x|f(x)dx < \infty$ ，则X存在数学期望，其数学期望表达式为：
  
  $\int_{-\infty}^{\infty} xf(x)dx$

2. 性质

若干个随机变量之和的期望等于他们各自的期望之和，即：

$E(X_1 + ... + X_n) = E(X_1) + ... + E(X_n)$
若干个独立随机变量之积的期望等于他们各自的期望之积，即：

$E(X_1X_2...X_n) = E(X_1)E(X_2)...E(X_n)$
随机变量函数的期望可以表示为：
1. 离散型
  
  $\sum_i g(a_i)p_i$
2. 连续型
  
  $\int_{-\infty}^{\infty} g(x) f(x) dx$
如果 $c$ 为一个常数，则：

$E(c\cdot X) = c \cdot E(X)$

2. 中位数

设连续型随机变量X的分布函数为 $F (x)$ ，则满足条件 $\leq m) = F(m) = 1/2$ 的数m成为X或者分布F的中位数。

3. 方差 & 标准差

1. 定义

设 $X$ 为随机变量，分布为 $F$ ，则定义
$Var(X) = E(X - EX)^2 = E(X^2) - EX^2$
称为 $X$ （或者分布F）的方差，其平方根 $\sqrt{Var(X)}$ 称为 $X$ （或者分布 $F$ ）的标准差。

推广：矩的定义

设 $X$ 为随机变量， $c$ 为常数， $k$ 为正整数，则定义 $E[(X-c)^k]$ 称为 $X$ 关于 $c$ 点的 $k$ 阶矩。
- 若 $c = 0$ ，则称 $a_k = E(X^k)$ 为 $X$ 的 $k$ 阶原点矩，特别的，一阶原点矩就是期望；
- 若 $c = E X$ ，这时 $\mu_k=E[(X-EX)^k]$ 称为 $X$ 的 $k$ 阶重心矩，特别的，一阶中心矩为常数0，二阶中心矩即为方差；

2. 性质

常数的方差为0；
若C为常数，则 $V a r (X + C)$ = Var(X);
若C为常数，则 $C^2 \cdot Var(X)$ ;
独立随机变量之和的方差等于各变量方差之和：
$Var(X_1 + ... + X_n) = Var(X_1) + ... + Var(X_n)$

4. 协方差 & 相关系数

1. 协方差

考察两个一维随机变量 $X, Y$ ，假设：

$m_1, EY = m_2, Var(X) = \sigma_1^2, Var(Y) = \sigma_2^2$

则我们有定义：

称 $E[(X-m_1)(Y-m_2)]$ 为X和Y的协方差，记作 $C o v (X, Y)$ 。

我们有性质：

若X和Y独立，则 $C o v (X, Y) = 0$ ;
$Y)^2 \leq \sigma_1^2 \sigma_2^2$ ，等号当且仅当X和Y满足严格的线性关系（即 $Y = a X + b$ ）时成立；

2. 相关系数

在上述协方差的基础上，我们可以定义相关系数如下：

定义相关系数 $(\sigma_1 \sigma_2)$ .

同样的，有性质：

若 $X, Y$ 独立，则 $C o r r (X, Y) = 0$ ；
$\leq 1$ ，且等号当且仅当X和Y存在严格线性关系时取到。

5. 大数定理

1. 大数定理

设 $X_1, X_2, ..., X_n, ...$ 是独立同分布的随机变量，记它们的公共均值为 $a$ ，方差为 $\sigma^2$ ，则对任意给定的 $\epsilon > 0$ ，有：
${lim}_{n \to \infty} P(|\bar{X_n} - a| \geq \epsilon) = 0$

用直白的语言来说：

就是当重复实验足够多时，频率总能够无限趋近于概率。

2. 马尔可夫不等式

若Y为只取非负值的随机变量，则对于任意常数 $\epsilon > 0$ ，有：
$\geq \epsilon) \leq E(Y) / \epsilon$

3. 切比雪夫不等式

若 $V a r (X)$ 存在，则：
$\geq \epsilon) \leq Var(Y) / \epsilon^2$

6. 中心极限定理

中心极限定理是一系列定理的集合，整体来说就是一系列独立同分布的变量之和满足正态分布。

1. 林德伯格-莱维定理

设 $X_1, X_2, ..., X_n, ...$ 为独立同分布的随机变量， $E(X_i) = a, Var(X_i) = \sigma^2$ ，则对任意实数 $x$ 有：
$lim_{n\to \infty} P(\frac{1}{\sqrt{n}\sigma}(X_1 + ... + X_n - na) \leq x) = \Phi(x)$
其中 $\Phi(x)$ 是标准正态分布 $N (0, 1)$ 的分布函数，即 $\Phi(x) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-t^2/2}dt$

2. 棣莫弗-拉普拉斯定理

设 $X_1, X_2, ..., X_n, ...$ 独立同分布， $X_i$ 为二次分布，即 $P(X_i=1) = p, P(X_i=0)=1-p$ ，则对于任意实数 $x$ ，有：
$lim_{n\to \infty} P(\frac{1}{\sqrt{np(1-p)}} (X_1 + ... + X_n - np) \leq x) = \Phi(x)$