随机过程(二)——随机变量

最新推荐文章于 2024-04-15 11:05:27 发布

YSQ是我的

最新推荐文章于 2024-04-15 11:05:27 发布

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏： # 随机过程文章标签：随机过程随机变量

本文链接：https://blog.csdn.net/u011609063/article/details/102598057

随机过程专栏收录该内容

2 篇文章

订阅专栏

本文全面介绍了随机变量的概念，包括离散和连续随机变量的定义、概率质量函数、概率密度函数及累积分布函数。深入探讨了伯努利、二项、几何、超几何、泊松等离散分布，以及均匀、指数、伽马、正态等连续分布的特性，期望和方差。同时，讲解了联合分布、矩母函数、极限定理等内容。

1. 随机变量

随机变量： 定义在样本空间上的实值函数，称为随机变量。例如掷骰子时，我们关心的是两颗骰子的点数和，而不是两次骰子具体的点数，我们所关注的量，即点数和，就是随机变量。

示性随机变量： $\begin{cases} 1 & 电池的寿命是两年或者更长 \\ 0 & 其他情形 \end{cases}$
以E记电池的寿命是两年或者更长，那么随机变量 $I$ 称为事件E的示性随机变量。 $I$ 的取值依赖于E是否发生

概率质量函数： 描述离散型随机变量的输出值

概率密度函数： 描述连续型随机变量的输出值

累积分布函数F：
$\forall a \in R，F(a) = P\{X \leq a \} = \begin{cases} \sum \limits_{\forall x_i \leq a} p(x_i) & X为离散随机变量 \\ \int \limits_{- \infty}^a f(x) dx & X为连续随机变量 \end{cases}$

F的性质：
1. F(b)是b的非减函数
2. $\lim_{b \to \infty}F(b) = F(\infty) = 1$
3. $\lim_{b \to -\infty} F(b) = F(-\infty) = 0$

$\forall a < b，有P\{a < X \leq b\} = F(b) - F(a)$

$P\{X < b\} = \lim \limits_{h \to 0^+} P\{X \leq b - h\} = \lim \limits_{h \to 0^+} F(b - h)$

$P\{X < b\}$ 不一定等于F(b)，因为F(b)也包括X=b的概率

变量期望E(X)：
$\begin{cases} \sum \limits^{\infty}_{k}x p(x) & x为离散随机变量 \\ \int \limits^{\infty}_{- \infty} xf(x) dx & x为连续随机变量 \end{cases}$

函数期望E[g(X)]：
$\begin{cases} \sum \limits^{\infty}_{k} g(x) p(x) & x为离散随机变量 \\ \int \limits^{\infty}_{- \infty} g(x) f(x) dx & x为连续随机变量 \end{cases}$

若a和b都是常数，则 $E [a X + b] = a E [X] + b$
随机变量X的期望E(X)称为均值或X的一阶矩。 $E(X^n),\ n \geq 1$ 称为X的n阶矩。

$E[X^n] = \begin{cases} \sum \limits_{x:p(x) > 0} x^n p(x) & X为离散 \\ \\ \int \limits^\infty_{- \infty} x^n f(x) dx & X 为连续 \end{cases}$

方差D(X)：
$D(X) = E[(X - E[X])^2] = E(X^2) - [E(X)]^2$

例如：
X代表掷一颗均匀的骰子的结果，求Var(X)
解：
$\sum \limits^6_{i = 1} i \times \frac{1}{6} = \frac{7}{2} \\ E(X^2) = \sum \limits^6_{i = 1} i^2 \times \frac{1}{6} = \frac{91}{6} \\ Var(X) = \frac{91}{6} - (\frac{7}{2})^ 2 = \frac{35}{12}$

易混淆概念：
1. 概率质量函数针对离散随机变量
2. 概率密度函数针对连续随机变量
3. 累积分布函数也叫分布函数，是概率密度函数的积分

2. 离散随机变量、期望、方差

2.1 离散随机变量

一个最多取可数个可能值的随机变量，称为离散随机变量。对于一个离散随机变量X，用 $p(a) = P\{X = a\}$ 定义概率质量函数p(a)

$\in \{x_1,\ x_2,\ \cdots \} \Rightarrow \begin{cases} p(x_i) > 0 & i = 1,\ 2,\ \cdots \\ p(x) = 0 & 所有其它x值 \end{cases}$

$\in \{x_1,\ x_2,\ \cdots \} \Rightarrow \sum \limits^{\infty}_{i = 1} p(x_i) = 1$ ，故累积分布函数F可以用p(a)表示为 $\sum \limits_{\forall x_i \leq a} p(x_i)$

例如：
假定X具有由 $\\p(1) = \frac{1}{2}，p(2) = \frac{1}{3}，p(3) = \frac{1}{6}\newline$ 给出的概率质量函数，则X的累积分布函数为
$\begin{cases} 0 & a < 1 \\ \frac{1}{2} & 1 \leq a < 2 \\ \frac{1}{3} & 2 \leq a < 3 \\ \frac{1}{6} & 3 \leq a \end{cases}$

2.2 伯努利随机变量：

试验的结果只有成功与失败，在成功时令X=1，在失败时令X=0，则X的概率质量函数
$P\{X = 0\} = 1 - p \\ p(1) = P\{X = 1\} = p\newline$ 随机变量X称为伯努利随机变量。

期望：
$\times (1 - p) + 1 \times p = p$

方差：
$D(X) = E(X^2) - [E(X)]^2 = p - p^2 = p(1-p)$

2.3 二项随机变量

假定做了n次独立试验，其中每次结果为成功的概率为p，失败的概率为 $1 - p$ ，如果以X代表出现在n次实验中成功的次数，那么X称为具有参数 $(n, p)$ 的二项随机变量。X的概率质量函数为
$\dbinom{n}{i} p^i (1 - p)^{n - i},\quad i = 0,\ 1,\ \cdots,\ n \\ \dbinom{n}{i} = C^{i}_{n} = \frac{n!}{(n - i)! i!}$

期望：
$E (X) = n p$
求解过程：
$\begin{aligned} E[X] & = \sum^n_{i = 0} i p(i) \\ & = \sum^n_{i = 0} i \dbinom{n}{i} p^i (1 -p)^{n - i} \\ & = \sum^n_{i = 1} \frac{i n!}{(n - i)! i!} p^i (1 - p)^{n - i} \\ & = \sum^n_{i = 1} \frac{n!}{(n - i)! (i - 1)!} p^i (1 - p)^{n - i} \\ & = np \sum^n_{i = 1} \frac{(n - 1)!}{(n - i)! (i - 1)!} p^{i - 1}(1 - p)^{n - i} \\ & = np \sum^{n - 1}_{k = 0} \dbinom{n - 1}{k} p^k (1 - p)^{n - 1 - k} \\ & = np[p + (1 - p)]^{n - 1} \\ & = np \end{aligned}$

方差：
$D (X) = n p (1 - p)$
求解过程：
$\begin{aligned} E[X^2] & = \sum^n_{i = 0} i^2 p(i) \\ & = \sum^n_{i = 0} i^2 \dbinom{n}{i} p^i (1 -p)^{n - i} \\ & = np \sum^n_{i = 1} \frac{i (n - 1)!}{(n - i)! (i - 1)!} p^{i - 1}(1 - p)^{n - i} \\ & = np \sum^{n - 1}_{k = 0} \frac{(k + 1) (n - 1)!}{(n - 1 - k)! k!} p^k (1 - p)^{n - 1 - k} \\ & = np \left[ \sum^{n - 1}_{k = 0} \dbinom{n - 1}{k} p^k (1 - p)^{n - 1 - k} + \sum^{n - 1}_{k = 0} \frac{k (n - 1)!}{(n - 1 - k)! k!} p^k (1 - p)^{n - 1 - k} \right] \\ & = np[1 + (n - 1)p] \\ \end{aligned} \\ D(X) = E(X^2) - E^ 2 (X) = np[1 + (n - 1)p] - (np)^2 = np(1 - p)$

2.4 几何随机变量

假定进行独立试验直到出现一个结果为成功，其中每一个试验成功的概率都是p，如果以X记直到出现首次成功所需要做的试验次数，则称X为具有参数p的几何随机变量。概率质量函数为 $\\p(n) = P\{X = n\} = (1 - p)^{n - 1}p, \quad n =1,\ 2,\ \cdots$

期望：
$\frac{1}{p}$
求解过程：
$\begin{aligned} E[X] & = \sum^{\infty}_{n = 1}n p (1-p)^{n - 1} \\ & = p\sum^{\infty}_{n = 1} nq^{n - 1} (q = 1 - p) \\ & = p \sum^{\infty}_{n = 1} \frac{d q^n}{dq} \\ & = p \frac{d (\sum^{\infty}_{n = 1}q^n)}{dq} \\ & = p \frac{d(\frac{q}{1- q})}{dq} \\ & = \frac{p}{(1 - q)^2} \\ & = \frac{1}{p} \end{aligned}$

方差：
$\frac{1 - p}{p^2}$
求解过程：
$\begin{aligned} E(X^2) & = \sum^{\infty}_{n = 1} n^2 p (1-p)^{n - 1} \\ & = p\sum^{\infty}_{n = 1} n^2 q^{n - 1} (q = 1 - p) \\ & = p \left(\sum^{\infty}_{n = 1} n q^n \right)^{'}_q \\ & = p \left(q \sum^{\infty}_{n = 1} n q^{n - 1} \right)^{'}_q \\ & = p \left( \frac{q}{(1 - q)^2} \right)^{'}_q \\ & = \frac{2 - p}{p^2} \end{aligned} \\ D(X) = E(X^2) - E^2(X) = \frac{2 - p}{p^2} - \frac{1}{p^2} = \frac{1 - p}{p^2}$

2.5 超几何随机变量

超几何分布： 从有限N个物件(包含M个指定种类的物件)中抽出n个物件，成功抽出该指定种类的物件的次数(不放回)
概率密度函数：
$P\{X = k\} = \frac{C^k_M C^{n - k}_{N - M}}{C^n_N}$

期望：
$\frac{nM}{N}$
求解过程：

方差：
$\frac{M}{N} (1 - \frac{M}{N})(1 - \frac{n - 1}{N - 1})$
求解过程：
略

2.6 泊松随机变量

泊松随机变量：
$\forall X \in N, \quad \exist \lambda > 0, \quad p(i) = P\{X = i\} = e^{-\lambda} \frac{\lambda^i}{i!} \quad i = 0,\ 1,\ \cdots$

期望：
$\lambda$
求解过程：
$\begin{aligned} E[X] & = \sum^{\infty}_{i = 0} \frac{i e^{- \lambda} \lambda^i}{i !} \\ & = \sum^{\infty}_{i = 1} \frac{e^{- \lambda} \lambda^i}{(i - 1)!} \\ & = \lambda e^{- \lambda} \sum^{\infty}_{k = 0} \frac{\lambda^k}{k!} \\ & = \lambda e^{- \lambda} e^{\lambda} = \lambda \end{aligned}$

方差：
$\lambda$
求解过程：
$\begin{aligned} E(X^2) & = \sum^{\infty}_{i = 0} \frac{i^2 e^{- \lambda} \lambda^i}{i !} \\ & = \lambda \sum^{\infty}_{i = 1} \frac{i e^{- \lambda} \lambda^{i - 1}}{(i - 1)!} \\ & = \lambda \left(e^{- \lambda} \sum^{\infty}_{k = 0} \frac{\lambda^k}{k!} + \lambda \int \limits^{\infty}_{k = 1} \frac{e^{-\lambda} \lambda ^{k - 1}}{(k - 1)!} \right) \\ & = \lambda \left(e^{- \lambda} e^{\lambda} + \lambda e^{-\lambda} e^\lambda \right) \\ & = \lambda (1 + \lambda) \end{aligned} \\ D(X) = E(X^2) - E^2(X) = \lambda(1 + \lambda) - \lambda^2 = \lambda$

例如：
在这里插入图片描述

2.7 总结

离散概率分布	概率质量函数 $p (x)$	矩母函数 $\phi(t)$	期望 $E (X)$	方差 $D (X)$
离散随机变量	$p(a) = P\{X = a\}$	$\sum_x e^{tx} p(x)$	$\sum_x x p(x) \\ \phi^\prime(0)$	$E(X^2) - E^2(X) \\ \phi^{\prime \prime}(0) - [\phi^\prime(0)]^2$
伯努利分布	$\\ p(1) = p$	$pe^t + (1 - p)$	$p$	$p (1 - p)$
二项分布	$\dbinom{n}{x} p^x (1 - p)^{n - x}$	$pe^t + (1 - p))^n$	$n p$	$n p (1 - p)$
几何分布	$p(x) = (1 - p)^{x - 1}p$	$\frac{p e^t}{1 - (1 - p) e^t}$	$\frac{1}{p}$	$\frac{1 - p}{p^2}$
超几何分布	$\frac{C^x_M C^{n - x}_{N - M}}{C^n_N}$	$\sum_x e^{tx} p(x)$	$\frac{nM}{N}$	$n\frac{M}{N}(1 - \frac{M}{N})(1 - \frac{n - 1}{N - 1})$
泊松分布	$e^{-\lambda} \frac{\lambda^x}{x!}$	$e^{\lambda(e^t - 1)}$	$\lambda$	$\lambda$

3. 连续随机变量、期望、方差

3.1 连续随机变量

一个随机变量的可能值是不可数的，记为X，则X是一个连续的随机变量。 $\exist f(x) \geq 0且x \in (-\infty,\ \infty)，使\forall 实数X \in B$ ，有X的概率密度函数为 $P\{X \in B\} = \int_Bf(x) dx$

$f (x)$ 必定满足 $P\{X \in (-\infty,\ \infty)\} = \int^{\infty}_{-\infty} f(x) dx$

例如：设 $[a,\ b],\ 则P\{a \leq X \leq b\} = \int^{b}_{a} f(x) dx$

累积分布函数F和 $f$ 的关系表示为 $\\F(a) = P\{X \in (-\infty, a]\} = \int \limits^a_{-\infty} f(x) dx$

密度函数是累积分布函数的导数

期望：
$\int \limits^{\infty}_{- \infty} xf(x) dx$

方差：
$E(X^2) - E^2(X) = \int \limits^{\infty}_{- \infty} x^2 f(x) dx - \left[ \int \limits^{\infty}_{- \infty} x f(x) dx \right]^2$

3.2 均匀随机变量

均匀随机变量： 一个随机变量X在 $(\alpha,\ \beta)$ 的任意特定子区间的概率等于该子区间的长度。

X是区间 $(\alpha,\ \beta)$ 上的均匀随机变量，则概率密度函数为
$\begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & 其它 \end{cases}$

期望：
$\frac{\beta + \alpha}{2}$
求解过程：
$\begin{aligned} E(X) & = \int^\beta_\alpha \frac{x}{\beta - \alpha} dx \\ & = \frac{x^2}{2(\beta - \alpha)} |^\beta_\alpha \\ & = \frac{\beta + \alpha}{2} \end{aligned}$

方差：
$\frac{(\beta - \alpha)^2}{12}$
求解过程：
$\begin{aligned} E(X^2) & = \int \limits^\beta_\alpha \frac{x^2}{\beta - \alpha} dx \\ & = \frac{x^3}{3(\beta - \alpha)} |^\beta_\alpha \\ & = \frac{\beta^2 + \alpha_2 + \alpha\beta}{3} \end{aligned} \\ D(X) = E(X^2) - E^2(X) = \frac{\beta^2 + \alpha^2 + \alpha\beta}{3} - [\frac{\beta - \alpha}{2}]^2 = \frac{(\beta - \alpha)^2}{12}$

$\newline$

例如：
1. 计算均匀分布在 $(\alpha, \beta)$ 上的随机变量的累积分布函数。
解：
$\begin{cases} \frac{1}{\beta - \alpha} & \alpha < x < \beta \\ 0 & 其它 \end{cases}$
累积分布函数 $\int^a_{- \infty} f(x) dx$
当 $\leq \alpha$ 时， $\int^a_{- \infty} f(x) dx = \int^a_{- \infty} 0 dx = 0$
当 $\beta$ 时， $\int^a_{- \infty} f(x) dx = \int^{\alpha}_{- \infty} f(x) dx + \int^{a}_{\alpha} f(x) dx = 0 + \frac{1}{\beta - \alpha} x |^a_\alpha = \frac{a - \alpha}{\beta - \alpha}$
当 $\geq \beta$ 时， $\int^{a}_{- \infty} f(x) dx = \int^{\alpha}_{- \infty} f(x) dx + \int^{\beta}_{ \alpha} f(x) dx + \int^{a}_{\beta} f(x) dx = 0 + \frac{1}{\beta - \alpha} |^\beta_\alpha + 0 = 1$
综上有
$\begin{cases} 0 & a \leq \alpha \\ \frac{a - \alpha}{\beta - \alpha} & \alpha < a < \beta \\ 1 & \alpha \geq \beta \end{cases}$

$\newline$

2. X均匀分布在 $(0,\ 10)$ 上，计算概率 $\quad (b) X > 7 \quad (c) 1 < X < 6$
解：
$\begin{cases} \frac{1}{10} & 0 < x < 10 \\ 0 & 其它 \end{cases}$
则
$P\{X < 3\} = \int^3_{- \infty} f(x) dx = \int^0_{- \infty} 0 dx + \int^3_0 \frac{1}{10} dx = \frac{3}{10} \\ P\{X > 7\} = \int^{\infty}_{- \infty} f(x) dx - \int^{7}_{- \infty} f(x) dx = \int^{10}_0 \frac{1}{10} dx - \int^{7}_{0} \frac{1}{10} dx = \frac{3}{10} \\ P\{1 < X < 6\} = \int^6_1 \frac{1}{10} dx = \frac{1}{2}$

3.3 指数随机变量

若一个连续随机变量的概率密度函数给定为，对于某个 $\lambda > 0$
$\begin{cases} \lambda e^ {- \lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}$
则称其为具有参数 $\lambda$ 的指数随机变量。

累积分布函数F为
$\int \limits^a_0 \lambda e^{- \lambda x} dx = 1 - e^{- \lambda a} \quad a \geq 0$

期望：
$\frac{1}{\lambda}$
求解过程：
$\begin{aligned} E(X) & = \int^\infty_0 x \lambda e^{- \lambda x} dx \\ & = \int^\infty_0 -x d(e^{- \lambda x}) \\ & = -x e^{- \lambda x} |^\infty_0 + \int^\infty_0 e^{- \lambda x} dx \\ & = -x e^{- \lambda x} |^\infty_0 - \frac{1}{\lambda} e^{- \lambda x} |^\infty_0 \\ & = \frac{1}{\lambda} \end{aligned}$

方差：
$\begin{aligned} E(X^2) & = \int^\infty_0 x^2 \lambda e^{- \lambda x} dx \\ & = \int^\infty_0 -x^2 d(e^{- \lambda x}) \\ & = -x^2 e^{- \lambda x} |^\infty_0 + \int^\infty_0 e^{- \lambda x} dx^2 \\ & = -x^2 e^{- \lambda x} |^\infty_0 - \frac{2}{\lambda} \left[x e^{- \lambda x} |^\infty_0 + \frac{1}{\lambda} e^{- \lambda x} |^\infty_0 \right] \\ & = 0 - \frac{2}{\lambda} (0 - \frac{1}{\lambda}) \\ & = \frac{2}{\lambda^2} \end{aligned} \\ D(X) = E(X^2) - E^2(X) = \frac{2}{\lambda^2} - (\frac{1}{\lambda})^2 = \frac{1}{\lambda^2}$

3.4 伽马随机变量

密度函数给定为，对于 $\lambda > 0，\alpha > 0$ ，
$\begin{cases} \frac{\lambda e^{- \lambda x}(\lambda x) ^ {\alpha - 1}}{\Gamma(\alpha)} & x \geq 0 \\ 0 & x < 0 \end{cases}$ 的连续随机变量，称为具有参数 $\lambda$ 和 $\alpha$ 的伽马随机变量。 $\Gamma(\alpha)$ 称为伽马函数，定义为 $\Gamma(\alpha) = \int^\infty_0 e^{-x} x^{\alpha - 1} dx$

3.5 正态随机变量

X是具有参数 $\mu$ 和 $\sigma^2$ 的正态随机变量(或者简单地说，X是正态地分布)，X的概率密度函数为
$\frac{1}{\sqrt{2 \pi} \sigma} e^{\frac{- (x - \mu)^2}{2 \sigma^2}}$

如果X以参数 $\mu$ 和 $\sigma^2$ 正态地分布，那么 $\alpha X + \beta$ 以参数 $\alpha \mu + \beta$ 和 $\alpha^2 \sigma^2$ 正态地分布

期望：
$E (X) = u$
求解过程：
$\begin{aligned} E(X) & = \frac{1}{\sqrt{2 \pi} \sigma} \int^\infty_{- \infty} x e^{\frac{-(x - \mu)^2}{2 \sigma^2}} dx \\ & = \frac{1}{\sqrt{2 \pi} \sigma} \int^\infty_{- \infty} (x - \mu) e^{\frac{-(x - u)^2}{2 \sigma^2}} dx + \mu \frac{1}{\sqrt{2 \pi} \sigma} \int^\infty_{- \infty} e^{\frac{-(x - \mu)^2}{2 \sigma^2}} dx \\ & = \frac{1}{\sqrt{2 \pi} \sigma} \int^\infty_{- \infty} y e^{\frac{-y^2}{2 \sigma^2}} dy + \mu \int^\infty_{- \infty} f(x) dx \\ & = \mu \int^\infty_{- \infty} f(x) dx \\ & = \mu \end{aligned}$

方差：
$\sigma^2$
求解过程：
略

3.6 总结

连续概率分布	概率密度函数 $f (x)$	矩母函数 $\phi(t)$	期望 $E (X)$	方差 $D (X)$
连续随机变量	$P\{X \in B\} = \int_Bf(x) dx$	$\int_B e^{tx} f(x) dx$	$\int_{-\infty}^{\infty}x f(x) dx\\ \phi^\prime(0)$	$E(X^2) - E^2(X) \\ \phi^{\prime \prime}(0) - [\phi^\prime(0)]^2$
均匀分布	$\begin{cases} \frac{1}{b - a} & a < x < b \\0 & 其它 \end{cases}$	$\frac{e^{bt} - e^{at}}{(b - a)t}$	$\frac{a + b}{2}$	$\frac{(b - a)^2}{12}$
指数分布	$\begin{cases} \lambda e^ {- \lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}$	$\frac{\lambda}{\lambda - t}$	$\frac{1}{\lambda}$	$\frac{1}{\lambda^2}$
伽马分布	$\begin{cases} \frac{\lambda e^{- \lambda x}(\lambda x) ^ {\alpha - 1}}{\Gamma(\alpha)} & x \geq 0 \\ 0 & x < 0 \end{cases}$	$\begin{pmatrix}\frac{\lambda}{\lambda - t}\end{pmatrix}^n$	$\frac{n}{\lambda}$	$\frac{n}{\lambda^2}$
正态分布	$\frac{1}{\sqrt{2 \pi} \sigma} e^{\frac{- (x - \mu)^2}{2 \sigma^2}}$	$e^{\mu t + \frac{\sigma^2 t^2}{2}}$	$\mu$	$\sigma^2$

4. 联合分布的随机变量

任意两个随机变量X和Y，定义X和Y的联合累积概率分布函数为
$F(a,\ b) = p\{X \leq a,\ Y \leq b\} \qquad -\infty < a, b < \infty$

X的分布可以由X和Y的联合分布得到
$F_X(a) = P\{X \leq a\} = P\{X \leq a,\ Y < \infty\} = F(a,\ \infty)$

Y的分布可以由X和Y的联合分布得到
$F_Y(b) = P\{Y \leq b\} = P\{X < \infty,\ Y \leq b\} = F(\infty,\ b)$

联合概率密度函数：
$\exist f(x, y),\ \forall x,\ y \in R,\ 有P\{X \in A,\ Y \in B\} = \int \limits_B \int \limits_A f(x,\ y) dx dy$

X的概率密度函数：
$f_X(x) = \int \limits^\infty_{- \infty} f(x,\ y) dy$

Y的概率密度函数：
$f_Y(y) = \int \limits^\infty_{- \infty} f(x,\ y) dx$

函数的概率密度函数：
$E[g(X,\ Y)] = \begin{cases} \sum \limits_y \sum \limits_x g(x,\ y) p(x,\ y) & 离散情形 \\ \int \limits^\infty_{- \infty} \int \limits^\infty_{- \infty} g(x,\ y) f(x,\ y) dx dy & 连续情形 \end{cases} \newline$

$E(\sum \limits_{i = 1}^n a_iX_i) = \sum \limits^n_{i = 1}a_i E(X_i)$

例如：在这里插入图片描述
独立随机变量： $\forall a,\ b,\ \ 有P\{X \leq a,\ Y \leq b\} = P\{X \leq a\} P\{Y \leq b\}$
若X和Y为独立随机变量，其联合分布函数为F，则 $F(a,\ b) = F_X(a) F_Y(b)$ 。
当X和Y都是离散时，独立的条件简化为 $p(x,\ y) = p_X(x) p_Y(y)$
当X和Y都是连续时，独立的条件简化为 $f(x\ y) = f_X(x) f_Y(y)$
若果X和Y是独立的，那么对于任意函数g和h，有 $E [g (X) h (Y)] = E [g (X)] E [h (Y)]$

协方差：
$\begin{aligned} Cov(X,\ Y) & = E[(X - E[X])(Y - E[Y])] \\ & = E[XY - YE[X] - XE[Y] + E[X]E[Y]] \\ & = E[XY] - E[Y]E[X] - E[X]E[Y] + E[X]E[Y] \\ & = E[XY] - E[X]E[Y] \end{aligned}$

若X和Y独立，则 $Cov(X,\ Y) = 0$
$Cov(X,\ Y) > 0 \Rightarrow$ X增加时，Y倾向于增加
$\newline Cov(X,\ Y) < 0 \Rightarrow$ X增加时，Y倾向于减少

$Cov(X,\ X) = Var(X) \newline Cov(X,\ Y) =Cov(Y,\ X) \newline Cov(cX,\ Y) = cCov(X,\ Y) \newline Cov(X,\ Y + Z) = Cov(X,\ Y) + Cov(X,\ Z) \newline Cov(\sum \limits^n_{i = 1}X_i,\ \sum \limits^n_{i = 1} Y_i) = \sum \limits^n_{i = 1} \sum \limits^n_{i = 1} Cov(X_i,\ Y_i)\newline$

$Var(\sum \limits^n_{i = 1}X_i) = \sum \limits^n_{i = 1} Var(X_i) + 2\sum \limits^n_{i = 1}\sum \limits_{j < i}Cov(X_i, X_j)$
当 $X_i$ 是独立随机变量时， $Var(\sum \limits^n_{i = 1} X_i) = \sum \limits^n_{i = 1}Var(X_i)$
这两个公式常用来计算方差
例如：
在这里插入图片描述

在这里插入图片描述

样本均值： 若 $X_1,\ \cdots,\ X_n$ 独立同分布，则随机变量 $\overline X = \sum \limits^n_{i = 1} \frac{X_i}{n}$ 就是样本均值
均值是总和/个数，期望是带上概率计算出来的“均值”

$X_1,\ \cdots,\ X_n独立同分布，E(X) = \mu，D(X) = \sigma^2$ ，则
$\quad 1.\quad E[\overline X] = \mu \\ \quad 2.\quad Var(\overline X) = \frac{\sigma^2}{n} \\ \quad 3.\quad Cov(\overline X,\ X_i - \overline X) = 0$

累积分布函数 $F_{X+Y}$ ： X, Y连续，
$\begin{aligned} F_{X + Y}(a) & = P\{X + Y \leq a\} \\ & = \int \int \limits_{x + y \leq a} f(x) g(y) dy \\ & = \int \limits^{\infty}_{- \infty} \int \limits^{a - y}_{- \infty} f(x) g(y) dxdy \\ & = \int \limits^{\infty}_{- \infty} \left(\int \limits^{a - y}_{- \infty} f(x) dx \right) g(y) dy \\ & = \int \limits^\infty_{- \infty} F_X(a - y) g(y) dy \end{aligned}$

概率密度 $f_{X + Y}(a)$
$\begin{aligned} f_{X + Y}(a) & = \frac{d}{da} F_{(X + Y)}(a) \\ & = \frac{d}{da} \int \limits^\infty_{- \infty} F_X(a - y) g(y) dy \\ & = \int \limits^\infty_{- \infty} \frac{d}{da} F_X(a - y) g(y) dy \\ & = \int \limits^\infty_{- \infty}f(a - y)g(y) dy \end{aligned}$

例如：
在这里插入图片描述

随机变量的函数的联合概率分布：
1. $y_1 = g_1(x_1, x_2)和y_2 = g_2(x_1, x_2)$ 可以唯一解出 $x_1$ 和 $x_2$ ，利用 $y_1$ 和 $y_2$ 给出 $x_1 = h_1(y_1, y_2)和x_2 = h_2(y_1, y_2)$
2. $g_1和g_2$ 在所有的点 $x_1, x_2)$ 上有连续的偏导数，且
$J(x_1, x_2) = \begin{vmatrix} \frac{d g_1}{d x_1} & \frac{d g_1}{d x_2} \\ \\ \frac{d g_2}{d x_1} & \frac{d g_2}{d x_2} \end{vmatrix} \neq 0$
在这两个条件下， $Y_1和Y_2$ 的联合密度函数为
$f_{Y_1, Y_2}(y_1, y_2) = f_{X_1, X_2}(x_1, x_2) \ |J(x_1, x_2)|^{-1}$
其中 $x_1 = h_1(y_1, y_2),\ x_2 = h_2(y_1, y_2)$
例如：
在这里插入图片描述

从上面那个例题中，我们可以发现， $X + Y 和 X / (X + Y)$ 是独立的，而且 $X + Y$ 有参数为 $(\alpha + \beta,\ \lambda)$ 的伽马分布，而 $X / (X + Y)$ 有密度函数 $f_V(v) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\ \Gamma(\beta)} v^{\alpha - 1} (1 - v)^{\beta - 1}，0 < v < 1$
联合概率分布个人理解是：
有一个由随机变量 $\cdots$ 组成的概率空间，然后通过某种映射方式将 $\cdots$ 映射到 $\cdots$ ，然后形成一个由 $\cdots$ 组成的新的概率空间。
贝塔密度(以 $(\alpha,\ \beta)$ 为参数)： $\frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\ \Gamma(\beta)} v^{\alpha - 1} (1 - v)^{\beta - 1}，0 < v < 1$

5. 矩母函数

$\phi (t) = E[e^{tX}] = \begin{cases} \sum_x e^{tX} p(x) \quad X离散 \\ \\ \int^\infty_{-\infty} e^{tx} f(x) dx \quad X连续 \end{cases}$
$\phi(t)$ 称为矩母函数，因为X的所有矩都能有 $\phi(t)$ 求微分(求导)得到
矩：对变量分布和形态特点的一组度量
$\phi^{(n)}(0) = E[X^n]$ ，即矩母函数的n阶导在t=0时等于 $E[X^n]$
期望： $\phi^\prime(0)$
方差： $\phi^{\prime \prime}(0) - [\phi^\prime(0)]^2$
$\phi_{X+Y}(t) = E[e^{t(X+Y)}] = E[e^{tX}e^{tY}] = E[e^{tX}]E[e^{tY}] = \phi_X(t)\phi_Y(t)$
独立随机变量和的矩母函数正是单个矩母函数的乘积
$\phi(t_1, \cdots, t_n) = E[e^{(t_1 X_1 + \cdots + t_n X_n)}]$
矩母函数唯一地确定了分布，即随机变量的矩母函数和分布函数之间存在一一对应。
拉普拉斯变换： $\phi(-t) = E[e^{-tX}]$ ，即拉普拉斯变换在t处的赋值正是矩母函数在-t处的赋值。
拉普拉斯变换永远在0与1之间
有同样拉普拉斯变换的非负随机变量有同样的分布

样本方差： 假定 $X_1, \cdots, X_n$ 是独立同分布随机变量，每个具有均值 $\mu$ 和方差 $\sigma^2$ ，则样本方差为 $S^2 = \sum^n_{i = 1} \frac{(X_i - \overline{X})^2}{n - 1}$
$\sum^n_{i = 1} (X_i - \overline{X})^2 = \sum^n_{i = 1} (X_i - \mu)^2 - n(\overline{X} - \mu)^2$
$E(S^2) = \sigma^2$

卡方随机变量： 若 $Z_1, \cdots, Z_n$ 是独立的标准正态随机变量，那么随机变量 $\sum^n_{i = 1} Z^2_i$ 称为具有自由度n的卡方随机变量
如果 $X_1,, \cdots, X_n$ 是独立同分布的正态随机变量，具有均值 $\mu$ 和方差 $\sigma^2$ ，那么样本均值 $\overline{X}$ 与样本方差 $S^2$ 是独立的。 $\overline{X}$ 是正态随机变量，具有均值 $\mu$ 和方差 $\frac{\sigma^2}{n}$ ， $\frac{(n - 1)S^2}{\sigma^2}$ 是具有n-1个自由度的卡方随机变量
在这里插入图片描述

在这里插入图片描述

6. 发生事件数的分布

7. 极限定理

马尔可夫不等式： X是只取非负值的随机变量，那么任意a > 0，有 $P\{X \ge a\} \leq \frac{E[X]}{a}$
证明：
在这里插入图片描述
切比雪夫不等式： 如果X是具有均值 $\mu$ 和方差 $\sigma^2$ 的随机变量，那么对于任意k>0，有 $P\{|X - \mu| \geq k\} \leq \frac{\sigma^2}{k^2}$

在这里插入图片描述
在只有概率分布的均值或者均值和方差已知时，它们使我们可以推得所求概率的上界

例如：
在这里插入图片描述

强大数定律： 设 $X_1, X_2, \cdots$ 是一列独立同分布的随机变量，令 $E[X_i] = \mu$ ，那么当 $\rightarrow \infty$ 时以概率1有
$\frac{X_1 + X_2 + \cdots + X_n}{n} \rightarrow \mu$

即一列独立同分布的随机变量的平均值以概率1收敛到这个分布的均值

中心极限定理： 假定 $X_1, X_2, \cdots$ 是一列独立同分布的随机变量，每个具有均值 $\mu$ 和方差 $\sigma^2$ ，那么当 $\rightarrow \infty$ 时
$\frac{X_1 + X_2 + \cdots + X_n - n \mu}{\sigma \sqrt{n}}$ 的分布趋于标准正态分布，即
$\rightarrow \infty，P\{\frac{X_1 + \cdots + X_n - n\mu}{\sigma \sqrt{n}} \leq a\} \rightarrow \frac{1}{\sqrt{2\pi}}\int^a_{-\infty} e^{-\frac{x^2}{2}}dx$