概率论与数理统计系列笔记之第四章——大数定理与中心极限定理

欧阳妙妙

已于 2022-11-30 22:57:22 修改

阅读量235

点赞数 1

文章标签：概率论

于 2022-11-26 23:04:06 首次发布

本文链接：https://blog.csdn.net/wantong_/article/details/128056337

版权

概率论与数理统计笔记（第四章大数定理与中心极限定理）

对于统计专业来说，书本知识总有遗忘，翻看教材又太麻烦，于是打算记下笔记与自己的一些思考，主要参考用书是茆诗松老师编写的《概率论与数理统计教程》，其他知识待后续书籍补充。

文章目录

概率论与数理统计笔记（第四章大数定理与中心极限定理）
第四章大数定理与中心极限定理

第四章大数定理与中心极限定理

4.1 随机变量的两种收敛性

4.1.1 依概率收敛

定义 4.1.1 设 $\left\{X_n\right\}$ 为一随机变量序列, $X$ 为一随机变量, 如果对任意的 $\varepsilon>0$ , 有
$P\left(\left|X_n-X\right| \geqslant \varepsilon\right) \rightarrow 0(n \rightarrow \infty),$
则称序列 $\left\{X_n \}\right.$ 依概率收敛于 $X$ , 记作 $X_n \stackrel{P}{\longrightarrow} X$ .
以下我们先给出依概率收敛于常数的四则运算性质.

定理 4.1.1 设 $\left|X_n\right|,\left|Y_n\right|$ 是两个随机变量序列, $a, b$ 是两个常数. 如果
$X_n \stackrel{P}{\longrightarrow} a, \quad Y_n \stackrel{P}{\longrightarrow} b,$ 则有
(1) $X_n \pm Y_n \stackrel{P}{\longrightarrow} a \pm b$ ;
(2) $X_n \times Y_{\mathrm{n}} \stackrel{P}{\longrightarrow} a \times b$ ;
(3) $X_n \div Y_n \stackrel{P}{\longrightarrow}a \div b(b \neq 0)$ .

4.1.2 按分布收敛、弱收敛

定义 4.1.2
设随机变量 $X_1, X_2, \cdots$ 的分布函数分别为 $F(x), F_1(x)$ , $F_2(x), \cdots$ , 若对 $F (x)$ 的任一连续点 $x$ , 都有
$\lim _{n \rightarrow \infty} F_n(x)=F(x),$
则称 $\left\{F_n(x)\right\}$ 弱收敛于 $F (x)$ , 记作

$F_n(x) \stackrel{W}{\longrightarrow} F(x) .$
也称 $\left\{X_n\right\}$ 按分布收敛于 $X$ , 记作
$X_n \stackrel{L}{\longrightarrow} X .$

下面的定理说明依概率收敛是一种比按分布收敛更强的收敛性.

定理 4.1.2 $X_n \stackrel{P}{\longrightarrow} X \Longrightarrow X_n \stackrel{L}{\longrightarrow} X$ .

定理 4.1.3 若 $c$ 为常数, 则 $X_n \stackrel{P}{\longrightarrow} c$ 的充要条件是: $X_n \stackrel{L}{\longrightarrow} c$ .

4.2 特征函数

设 $p (x)$ 是随机变量 $X$ 的密度函数, 则 $p (x)$ 的傅里叶变换是
$\varphi(t)=\int_{-\infty}^{\infty} \mathrm{e}^{i x} p(x) \mathrm{d} x,$
其中 $\mathrm{i}=\sqrt{-1}$ 是虚数单位. 由数学期望的概念知, $\varphi(t)$ 恰好是 $E\left(\mathrm{e}^{\mathrm{i} x}\right)$ .

4.2.1 特征函数的定义

复随机变量定义为 $Z=Z(w)=X(w)+\mathrm{i} Y(w)$ , 其中 $X (w)$ 与 $Y (w)$ 是定义在 $\Omega$ 上的实随机变量. 而 $\bar{Z}(w)=X(w)-\mathrm{i} Y(w)$ 称为 $Z (w)$ 的复共轭随机变量.
复随机变量 $Z = X + i Y$ 的模 $∣ Z ∣$ 定义为 $\sqrt{X^2+Y^2}$ , 或 $Z|^2=X^2+Y^2$ , 且 $\bar{Z}=X^2+Y^2=|Z|^2$ .
与随机变量有关的一些概念和定义, 一般都可类似地移到随机变量场合. 例如, 若随机变量 $X$ 与 $Y$ 的数学期望 $E (X)$ 与 $E (Y)$ 都存在, 则复随机变量 $Z =$ $X + i Y$ 的数学期望定义为 $E (Z) = E (X) + i E (Y)$ . 又如复随机变量 $Z_1=X_1+i Y_1$ 与 $Z_2=X_2+\mathrm{i} Y_2$ 相互独立当且仅当 $\left(X_1, Y_1\right)$ 与 $\left(X_2, Y_2\right)$ 相互独立. 在欧拉公式 $\mathrm{e}^{i X}=$ $\cos X+\mathrm{i} \sin X$ 中若 $X$ 是实随机变量, 则 $E\left(\mathrm{e}^{i X}\right)=E(\cos X)+\mathrm{i} E(\sin X)$ , 其模 $\left|\mathrm{e}^{i X}\right|=\sqrt{\cos ^2 X+\sin ^2 X}=1.$ 若 $X$ 与 $Y$ 独立, 则 $\mathrm{e}^{i x}$ 与 $\mathrm{e}^{i Y}$ 也独立.

定义 4.2.1
设 $X$ 是一个随机变量,称
$\varphi(t)=E\left(\mathrm{e}^{i t x}\right), \quad-\infty<t<\infty,$
为 $X$ 的特征函数.

当离散随机变量 $X$ 的分布列为 $p_k=P\left(X=x_k\right), k=1,2 ， \cdots$ , 则 $X$ 的特征函数为
$\varphi(t)=\sum_{k=1}^\infty \mathrm{e}^{i t x_k} p_k, \quad-\infty<t<\infty .$
当连续随机变量 $X$ 的密度函数为 $p (x)$ , 则 $X$ 的特征函数为
$\varphi(t)=\int_{-\infty}^\infty \mathrm{e}^{i t x} p(x) \mathrm{d} x, \quad-\infty<t<\infty .$

例 4.2.1 常用分布的特征函数
(1) 单点分布 $P (X = a) = 1$ , 其特征函数为
$\varphi(t)=e^{i t} \text {. }$
(2) 0-1 分布 $P(X=x)=p^x(1-p)^{1-x}, x=0,1$ , 其特征函数为
$\varphi(t)=p \mathrm{e}^{\mathrm{it}}+q \text {, 其中 } q=1-p \text {. }$
(3) 泊松分布 $P(\lambda) \quad P(X=k)=\frac{\lambda^k}{k !} \mathrm{e}^{-\lambda}, k=0,1, \cdots$ , 其特征函数为
$\varphi(t)=\sum_{i=0}^{\infty} \mathrm{e}^{\mathrm{i} t k} \frac{\lambda^k}{k !} \mathrm{e}^{-\lambda}=\mathrm{e}^{-\lambda} \mathrm{e}^{\lambda \boldsymbol{\lambda}^i}=\mathrm{e}^{\lambda(\mathrm{e}^{i t-1}).} .$
（4）均匀分布 $U (a, b)$ 因为密度函数为
$p(x)=\left\{\begin{array}{cl} \frac{1}{b-a}, & a<x<b, \\ 0, & \text { 其他, } \end{array}\right.$

所以其特征函数为
$\varphi(t)=\int_a^b \frac{e^{i t x}}{b-a} \mathrm{~d} x=\frac{e^{\mathrm{ibt}}-\mathrm{e}^{\mathrm{iat}}}{\mathrm{i} t(b-a)} .$
(5) 标准正态分布 $N (0, 1)$ 因为密度函数为
$p(x)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{x^2}{2}}, \quad-\infty<x<\infty,$
所以其特征函数为
$\begin{aligned} \varphi(t) &=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} \mathrm{e}^{\mathrm{i} tx} \mathrm{e}^{-\frac{x^2}{2}} \mathrm{~d} x=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} \sum_{n=0}^{\infty} \frac{(\mathrm{i} t x)^n}{n !} \mathrm{e}^{-\frac{x^2}{2}} \mathrm{~d} x \\ &=\sum_{n=0}^{\infty} \frac{(\mathrm{i} t)^n}{n !}\left[\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} x^n \mathrm{e}^{-\frac{x^2}{2}} \mathrm{~d} x\right], \end{aligned}$
上式中方括号内正是标准正态分布的 $n$ 阶矩 $E\left(X^n\right)$ . 当 $n$ 为奇数时 $E\left(X^n\right)=0$ ; 当 $n$ 为偶数时, 如 $n = 2 m$ 时,
$E\left(X^n\right)=E\left(X^{2 m}\right)=(2 m-1) ! !=\frac{(2 m) !}{2^m \cdot m !},$
代回原式, 可得标准正态分布的特征函数
$\varphi(t)=\sum_{m=0}^{\infty} \frac{(\mathrm{i} t)^{2 m}}{(2 m) !} \cdot \frac{(2 m) !}{2^m \cdot m !}=\sum_{m=0}^{\infty}\left(-\frac{t^2}{2}\right)^m \frac{1}{m !}=\mathrm{e}^{-\frac{t^2}{2}}$

(6) 指数分布 $\operatorname{Exp}(\lambda)$ 因为密度函数为
$\begin{cases}\lambda \mathrm{e}^{-\lambda x}, & x>0, \\ 0, & x \leqslant 0,\end{cases}$
所以其特征函数为
$\begin{aligned} \varphi(t) =\left(1-\frac{\mathrm{i} t}{\lambda}\right)^{-1} . \end{aligned}$

4.2.2 特征函数的性质

性质 4.2.1 $|\varphi(t)| \leqslant \varphi(0)=1$ .
性质 4.2.2 $\varphi(-t)=\overline{\varphi(t)}$ , 其中 $\overline{\varphi(t)}$ 表示 $\varphi(t)$ 的共轭.
性质 4.2.3 若 $Y = a X + b$ , 其中 $a, b$ 是常数, 则
$\varphi_y(t)=\mathrm{e}^{i b t} \varphi_X(a t) .$
性质 4.2.4 独立随机变量和的特征函数为每个随机变量的特征函数的积, 即设 $X$ 与 $Y$ 相互独立, 则
$\varphi_{X, Y}(t)=\varphi_X(t) \varphi_Y(t) .$
性质 4.2.5 若 $E\left(X^{l}\right)$ 存在, 则 $X$ 的特征函数 $\varphi(t)$ 可 $l$ 次求导, 且对 $\leqslant k \leqslant l$ , 有
$\varphi^{(k)}(0)=\mathrm{i}^k E\left(X^k\right) .$
上式提供了一条求随机变量的各阶矩的途径,特别可用下式去求数学期望和方寿.
$E(X)=\frac{\varphi^{\prime}(0)}{\mathrm{i}}, \quad \operatorname{Var}(X)=-\varphi^{\prime \prime}(0)+\left(\varphi^{\prime}(0)\right)^2 .$
例 $4.2.2$ 常用分布的特征函数（二)
(1) 二项分布 $b (n, p)$ 设随机变量 $\sim b(n, p)$ , 则 $Y=X_1+X_2+\cdots+X_n$ , 其中诸 $X_i$ 是相互独立同分布的随机变量, 且 $X_i \sim b(1, p)$ . 由例 $4.2.1$ (2) 知
$\varphi_{X_i}(t)=p \mathrm{e}^{\mathrm{it}}+q .$
所以由独立随机变量和的特征函数为特征函数的积, 得
$\varphi_Y(t)=\left(p \mathrm{e}^{i t}+q\right)^n .$
(2) 正态分布 $N\left(\mu, \sigma^2\right)$ 设随机变量 $\sim N\left(\mu, \sigma^2\right)$ , 则 $X=(Y-\mu) / \sigma \sim$ $N (0, 1)$ . 由例 $4, 2, 1$ 知
$\varphi_x(t)=\mathrm{e}^{-\frac{\mathrm{t}^2}{2}} .$
所以由 $Y=\sigma X+\mu$ 和性质 $4.2.3$ 得
$\varphi_Y(t)=\varphi_{\sigma X+\mu}(t)=\mathrm{e}^{i \mu t} \varphi_X(\sigma t)=\exp \left\{i \mu t-\frac{\sigma^2 t^2}{2}\right\} .$
(3) 伽玛分布 $\lambda)$ 设随机变量 $\sim G a(n, \lambda)$ , 则 $Y=X_1+X_2+\cdots+X_n$ , 其中 $X_i$ 独立同分布, 且 $X_i \sim \operatorname{Exp}(\lambda)$ . 由例 4.2.1 知
$\varphi_{X_i}(t)=\left(1-\frac{\mathrm{i} t}{\lambda}\right)^{-1} .$
所以由独立随机变量和的特征函数为特征函数的积,得
$\varphi_\gamma(t)=\left(\varphi_{X_1}(t)\right)^n=\left(1-\frac{\mathrm{i} t}{\lambda}\right)^{-n} .$
(4) $\chi^2(n)$ 分布 因为 $\chi^2(n)=G a(n / 2,1 / 2)$ , 所以 $\chi^2(n)$ 分布的特征函数为 $\varphi(t)=(1-2 i t)^{-n / 2}$ .

定理 4.2.1(一致连续性) 随机变量 $X$ 的特征函数 $\varphi(t)$ 在 $(-\infty, \infty)$ 上一致连续.

定理 4.2.2(非负定性) 随机变量 $X$ 的特征函数 $\varphi(t)$ 是非负定的, 即对任意正整数 $n$ 及 $n$ 个实数 $t_1, t_2, \cdots, t_n$ 和 $n$ 个复数 $z_1, z_2, \cdots, z_n$ , 有
$\sum_{k=1}^n \sum_{j=1}^n \varphi\left(t_k-t_j\right) z_k \bar{z}_j \geqslant 0 .$

4.2.3 特征函数唯一决定分布函数

定理 4.2.3 (逆转公式) 设 $F (x)$ 和 $\varphi(t)$ 分别为随机变量 $X$ 的分布函数和特征函数, 则对 $F (x)$ 的任意两个连续点 $x_1<x_2$ , 有
$F\left(x_2\right)-F\left(x_1\right)=\lim _{T \rightarrow \infty} \frac{1}{2 \pi} \int_{-T}^T \frac{\mathrm{e}^{-i t x_1}-\mathrm{e}^{-\mathrm{it} x_2}}{\mathrm{i} t} \varphi(t) \mathrm{d} t .$

定理 4.2.4 (唯一性定理) 随机变量的分布函数由其特征函数唯一决定.

定理 4.2.5 若 $X$ 为连续随机变量, 其密度函数为 $p (x)$ , 特征函数为 $\varphi(t)$ . 如果 $\int_{-\infty}^{\infty}|\varphi(t)| \mathrm{d} t<\infty$ , 则
$p(x)=\frac{1}{2 \pi} \int_{-\infty}^{\infty} \mathrm{e}^{-i t x} \varphi(t) \mathrm{d} t .$

定理 4.2.6 分布函数序列 ${F_n(x)\}$ 次收敛于分布函数 $F (x)$ 的充要条件是 ${F_n(x) \}$ 的特征函数序列 $\left.\{ \varphi_n(t)\right\}$ 收敛于 $F (x)$ 的特征函数 $\varphi(t)$ .

4.3 大数定理

4.3.1 伯努利大数定律

记 $s_n$ 为 $n$ 重伯努利试验中事件 $A$ 出现的次数,称 $\frac{s_n}{n}$ 为事件 $A$ 出现的频率. 如果记一次试验中 $A$ 发生的概率为 $p$ , 则 $s_n$ 服从二项分布 $b (n, p)$ , 因此频率 $\frac{s_n}{n}$ 的数学期望与方差分别为
$E\left(\frac{s_n}{n}\right)=p, \quad \operatorname{Var}\left(\frac{s_n}{n}\right)=\frac{p(1-p)}{n} .$

定理 4.3.1 (伯努利大数定律) 设 $s_n$ 为 $n$ 重伯努利试验中事件 $A$ 发生的次数, $p$ 为每次试验中 $A$ 出现的概率, 则对任意的 $\varepsilon>0$ , 有
$\lim _{n \rightarrow \infty} P\left(\left|\frac{s_n}{n}-p\right|<\varepsilon\right)=1 .$

4.3.2 常用的几个大数定律

一、大数定律的一般形式
定义 4.3.1
设有一随机变量序列 ${X_n\}$ , 假如它具有形如 $\lim _{n \rightarrow \infty} P\left(\left|\frac{1}{n} \sum_{i=1}^n X_i-\frac{1}{n} \sum_{i=1}^n E\left(X_i\right)\right|<\varepsilon\right)=1. \qquad (4.3.5)$ 的性质, 则称该随机变量序列 $\left\{X_n\right\}$ 服从大数定律.

二、切比雪夫大数定律

定理 4.3.2 (切比雪夫大数定律)
设 $\left\{X_n \right\}$ 为一列两两不相关的随机变量序列, 若每个 $X_i$ 的方差存在, 且有共同的上界, 即 $\operatorname{Var}\left(X_i\right) \leqslant c, i=1,2, \cdots$ , 则 ${X_n\}$ 服从大数定律, 即对任意的 $\varepsilon>0,$ 式(4.3.5)成立.

三、马尔可夫大数定律

定理 4.3.3 (马尔可夫大数定律) 对随机变量序列 $\left\{X_n\right\}$ , 若
$\frac{1}{n^2} \operatorname{Var}\left(\sum_{i=1}^n X_i\right) \rightarrow 0,$ 成立, 则 $\left\{X_n \}\right.$ 服从大数定律, 即对任意的 $\varepsilon>0,$ 式(4.3.5)成立.

四、辛钦大数定律

定理 4.3.4 (辛钦大数定律) 设 ${X_n\}$ 为一独立同分布的随机变量序列, 若 $X_i$ 的数学期望存在, 则 $\left\{X_n\right\}$ 服从大数定律, 即对任意的 $\varepsilon>0,(4.3 .5)$ 式成立.

4.4 中心极限定理

4.4.1 独立随机变量和

中心极限定理就是研究随机变量和的极限分布在什么条件下为正态分布的问题.

4.4.2 独立同分布下的中心极限定理

定理 4.4.1 (林德伯格-莱维 (Lindeberg-Lévy) 中心极限定理) 设 $\left\{X_n \}\right.$ 是独立同分布的随机变量序列, 且 $E\left(X_i\right)=\mu, \operatorname{Var}\left(X_i\right)=\sigma^2>0$ 存在, 若记
$Y_n^*=\frac{X_1+X_2+\cdots+X_n-n \mu}{\sigma \sqrt{n}},$
则对任意实数 $y$ , 有
$\lim _{n \rightarrow \infty} P\left(Y_n^* \leqslant y\right)=\Phi(y)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^y \mathrm{e}^{-\frac{t^2}{2}} \mathrm{~d} t .$

4.4.3 二项分布的正态近似

由林德伯格-莱维中心极限定理, 马上就可以得到下面的棣莫弗-拉普拉斯中心极限定理.

定理 4.4.2 (棣莫弗-拉普拉斯中心极限定理) 设 $n$ 重伯努利试验中, 事件 $A$ 在每次试验中出现的概率为 $p\ (0<p<1)$ , 记 $s_n$ 为 $n$ 次试验中事件 $A$ 出现的次数, 且记
$Y_n^*=\frac{s_n-n p}{\sqrt{n p q}} .$
则对任意实数 $y$ , 有
$\lim _{n \rightarrow \infty} P\left(Y_n^* \leqslant y\right)=\Phi(y)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^y \mathrm{e}^{-\frac{t^2}{2}} \mathrm{~d} t .$

棣莫弗-拉普拉斯中心极限定理是概率论历史上的第一个中心极限定理.它是专门针对二项分布的, 因此称为 “二项分布的正态近似”. 前面第二章中定理 2.4.1 (泊松定理) 给出了“二项分布的泊松近似”. 两者相比, 一般在 $p$ 较小时, 用泊松分布近似较好; 而在 $n p > 5$ 和 $n (1 - p) > 5$ 时, 用正态分布近似较好.

下面在给出棣莫弗 -拉普拉斯中心极限定理的应用之前, 先说明两点:
（1）因为二项分布是离散分布,而正态分布是连续分布, 所以用正态分布作为二项分布的近似计算中, 作些修正可以提高精度. 若 $k_1<k_2$ 均为整数, 一般先作如下修正后再用正态近似 $P\left(k_1 \leqslant s_n \leqslant k_2\right)=P\left(k_1-0.5<s_n<\right.$ $\left.k_2+0.5\right)$ .

(2) 对于二项分布的计算, 用修正的正态近似还可得
$\begin{aligned} &P(s_n=k)\\ &=P(k-0.5<s_n<k+0.5)\\ &=P\left(\frac{k-0.5-n p}{\sqrt{n p q}}<\frac{s_n-n p}{\sqrt{n p q}}<\frac{k+0.5-n p}{\sqrt{n p q}}\right) \\ \end{aligned}$

在中心极限定理的应用中, 若记 $\beta=\Phi(y)$ , 则由棣莫弗 $-$ 拉普拉斯中心极限定理给出的近似式
$P\left(Y_n^* \leqslant y\right) \approx \Phi(y)=\beta,$
可用来解决三类计算问题: (1) 已知 $n, y$ 求 $\beta$ ; (2) 已知 $\beta$ 求 $y$ ; (3) 已知 $\beta$ 求 $n$ .

4.4.4 独立不同分布下的中心极限定理

只要对任意的 $\tau>0$ , 有
$\lim _{n \rightarrow \infty} \frac{1}{\tau^2 B_n^2} \sum_{i=1}^n \int_{\left|x-\mu_{}\right|>\tau B_n}\left(x-\mu_i\right)^2 p_i(x) \mathrm{d} x=0,\ \ (4.4.5)$
就可保证 $Y_n^*$ 中各加项“均匀地小”.上述条件 (4.4.5) 称为林德伯格条件.

定理 4.4.3 (林德伯格中心极限定理) 设独立随机变量序列 $\left|X_n\right|$ 满足林德伯格条件, 则对任意的 $x$ , 有
$\lim _{n \rightarrow \infty} P\left(\frac{1}{B_n} \sum_{i=1}^n\left(X_i-\mu_i\right) \leqslant x\right)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^x e^{-i^2 / 2} \mathrm{~d} t .$

假如独立随机变量序列 $\left\{X_n\right\}$ 具有同分布和方差有限的条件, 则必定满足以上 (4.4.5) 林德伯格条件, 也就是说定理 4.4.1 是定理 4.4.3 的特例.

林德伯格条件虽然比较一般,但该条件较难验证,下面的李雅普诺夫( Lyapunov) 条件则比较容易验证, 因为它只对矩提出要求, 因而便于应用.

定理 4.4.4 (李雅普诺夫中心极限定理) 设 ${X_n\}$ 为独立随机变量序列, 若存在 $\delta>0$ , 满足
$\lim _{n \rightarrow \infty} \frac{1}{B_n^{2+\delta}} \sum_{i=1}^n E\left(\left|X_i-\mu_i\right|^{2+\delta}\right)=0,$
则对任意的 $x$ , 有
$\lim _{n \rightarrow \infty} P\left(\frac{1}{B_n} \sum_{i=1}^n\left(X_t-\mu_i\right) \leqslant x\right)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^x e^{-t^{2 / 2}} \mathrm{~d} t .$

欧阳妙妙

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
概率论与数理统计系列笔记之第四章——大数定理与中心极限定理

对于统计专业来说，书本知识总有遗忘，翻看教材又太麻烦，于是打算记下笔记与自己的一些思考，主要参考用书是茆诗松老师编写的《概率论与数理统计教程》，其他知识待后续书籍补充。
复制链接

扫一扫