概率论基础 - 9 - 中心极限定理

最新推荐文章于 2024-03-04 08:33:02 发布

苍蓝儿

最新推荐文章于 2024-03-04 08:33:02 发布

阅读量1.5k

点赞数

分类专栏：数学概率论机器学习文章标签：概率论算法机器学习

本文链接：https://blog.csdn.net/zywvvd/article/details/122728227

版权

概率论同时被 3 个专栏收录

11 篇文章 4 订阅

订阅专栏

机器学习

9 篇文章 1 订阅

订阅专栏

数学

4 篇文章 0 订阅

订阅专栏

中心极限定理（Central Limit Theorem，CTL），是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。。

概述

定理是数理统计学和误差分析的理论基础，指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理，有广泛的实际应用背景。在自然界与生产中，一些现象受到许多相互独立的随机因素的影响，如果每个因素所产生的影响都很微小时，总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。 ——百度百科

中心极限定理（CLT）指出，如果样本量足够大，则变量均值的采样分布将近似于正态分布，而与该变量在总体中的分布无关。

独立同分布

设随机变量 $X_1, X_2,\dots,X_n$ 独立同分布，且具有数学期望 $\mu$ 和方差 $\sigma^2$ ，前 $n$ 个变量之和为{%raw%}$\overline S = \sum\limits_{i = 1}^n {{X_i}} \${%endraw%}
那么 $\overline S_n$ 的期望和方差为 $n\mu$ 和 $n\sigma^2$ ， $\overline S_n$ 的标准化变量为：

$Y_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma}$

定义

中心极限定理的内容为： $Y_n$ 的概率分布函数 $F_n(x)$ 对于任意 $x$ 满足：

{%raw%}
$\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim \limits_{n \rightarrow \infty} P\left\{Y_{n} \leq x\right\}=\lim \limits_{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array}$
{%endraw%}

证明

通过观察某个分布的采样均值可以发现近似服从正态分布，我们的目标就是证明这个变量与正态分布的特征函数相同

引入一些特征函数的结论
正态分布的特征函数：

{%raw%}
${\varphi (t)}{ = {e^{ - \frac{{{t^2}}}{2}}}}$

{%endraw%}

标准正态分布的特征函数

随机变量 $X_i$ 的特征函数用 ${\varphi_x (t)}$ 表示
$\overline S_n$ 的特征函数为：

{%raw%}
${\varphi_{S_n} (t)}=[{\varphi_x (t)}]^n$

{%endraw%}

独立变量和的特征函数

$X_i$ 均值 $\overline X=\frac{1}{n}\overline {S_n}$ 的特征函数：

{%raw%}
${\varphi_{\overline X} (t)}={\varphi_{S_n} (\frac{t}{n})}=[{\varphi_x (\frac{t}{n})}]^n$

{%endraw%}

常数线性变换的特征函数

{%raw%} $Y_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma}=\frac{\overline X - \mu}{\frac{\sigma}{\sqrt n}}=\frac{\sqrt n}{\sigma}\overline X - \frac{\sqrt n}{\sigma} \mu$ {%endraw%}的特征函数：

{%raw%}
$\varphi_{y}(t)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot \varphi_{\bar{x}}\left(\frac{\sqrt{n}}{\sigma} t\right)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n}$

{%endraw%}

思路1

取对数：

{%raw%}
$$
\begin{aligned}
\ln \varphi_{y}(t)&=\ln \left{e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n}\right}\
&=-i \frac{\sqrt{n}}{\sigma} \mu t+n \ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]\
&=\frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\

\end{aligned}
$$

{%endraw%}

令 $p=\frac{t}{\sigma \sqrt{n}}$ , 当 $ n \rightarrow \infty $ 时, $ p \rightarrow 0$ 又：

{%raw%}
$$
\begin{aligned}

&\varphi_{x}(0)=\int_{-\infty}^{\infty} f(x) d x=1\
&\varphi_{x}^{{\prime}(0)=\int_{-\infty}}{\infty} i x f(x) d x=i \mu\
&\varphi_{x}^{\prime \prime}(0)=\int_{-\infty}^{\infty}-x{2} f(x) d x=-E\left(X^{{2}\right)=-\mu}{2}-\sigma^{2}\
\end{aligned}
$$

{%endraw%}

有：

{%raw%}
$$
\begin{aligned}

\lim {n \rightarrow \infty} \ln \varphi{y}(t)&=\lim {n \rightarrow \infty} \frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\
&=\frac{t^{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{-i \mu p+\ln \left[\varphi{x}§\right]}{p^{2}} \quad(\text { 洛必达) }\
&=\frac{t^{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{-i \mu+\frac{1}{\varphi{x}§} \cdot \varphi_{x}^{\prime}§}{2 p} \quad(\text { 洛必达 })\
&=\frac{t^{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{\varphi{x}^{\prime \prime}§ \cdot \varphi_{x}§-\varphi_{x}^{\prime}§ \cdot \varphi_{x}^{{\prime}§}{2\left[\varphi_{x}§\right]}{2}}\
&=\frac{t^{2}}{\sigma{2}} \cdot \frac{\varphi_{x}^{\prime \prime}(0) \cdot \varphi_{x}(0)-\varphi_{x}^{\prime}(0) \cdot \varphi_{x}^{{\prime}(0)}{2\left[\varphi_{x}(0)\right]}{2}}\
&=\frac{t^{2}}{\sigma{2}} \cdot \frac{\left(-\mu^{2}-\sigma{2}\right) \cdot 1-i \mu \cdot i \mu}{2 \cdot 1}\
&=-\frac{t^{2}}{2}
\end{aligned}
$$

{%endraw%}

思路2

{%raw%}
$\begin{array}{l} Y_{n}=\frac{n \bar{X}-\mu}{\sigma \sqrt{n}}=\frac{\sum_{i=1}^{n} \eta_{i}}{\sigma \sqrt{n}} \\\quad \eta_{i}=X_{i}-\mu \\ \varphi(t)=E\left(e^{i t Y_{n}}\right)=E\left(e^{i t \frac{\eta_{1}}{\sigma \sqrt{n}}} \cdot e^{i t \frac{\eta_{2}}{\sigma \sqrt{n}}} \cdot \ldots \cdot e^{i t \frac{\eta_{n}}{\sigma \sqrt{n}}}\right)=\left[\phi\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n} \end{array}$
{%endraw%}

$\phi(t)$ 为 $\eta_{i}$ 的特征函数
$\phi\left(\frac{t}{\sigma \sqrt{n}}\right)$ 在0点处的泰勒展开形式为:

{%raw%}
$\begin{aligned} \phi\left(\frac{t}{\sigma \sqrt{n}}\right)=\phi(0) &+\phi^{\prime}(0) \frac{t}{\sigma \sqrt{n}}+\frac{\phi^{\prime \prime}(0)}{2 !}\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \\ &=1+0-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \end{aligned}$
{%endraw%}

所以, $\varphi(t)$ 为:

{%raw%}
$\varphi(t)=\left(1-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right)\right)^{\left(-\frac{2 n}{t^{2}}\right) \times\left(-\frac{t^{2}}{2}\right)}=e^{-\frac{t^{2}}{2}}, n \rightarrow+\infty$
{%endraw%}

都得出结论

即有：

{%raw%}
$\lim _{n \rightarrow \infty} \varphi_{y}(t)={e^{ - \frac{{{t^2}}}{2}}}$

{%endraw%}

$Y_n$ 特征函数与正态分布相同，故有当$ n \rightarrow \infty $时，$ Y_n$服从正态分布的结论

应用思路

均值方差为 $\mu$ 和 $\sigma^2$ ，的独立同分布的随机变量 $X_i$ 前 $n$ 项之和 $\overline S_n$ 的标准变化量 $Y_n$ ，当 $n$ 充分大时，其分布近似于标准正态分布
即在 $n$ 充分大时， $\overline S_n$ 分布近似于 $N(n\mu,n\sigma^2)$
一般情况下，很难求出 $n$ 个随机变量之和的分布函数。因此当 $n$ 充分大时，可以通过正态分布来做理论上的分析或者计算

独立不同分布

Liapunov定理：设随机变量 $X_{1}, X_{2}, \cdots, X_{n}, \cdots$ 相互独立, 具有数学期望和方差:
$\mathbb{E}\left[X_{k}\right]=\mu_{k}, \operatorname{Var}\left[X_{k}\right]=\sigma_{k}^{2}$
记: $B_{n}^{2}=\sum_{k=1}^{n} \sigma_{k}^{2}$ 若存在正数 $\delta,$ 使得当 $\rightarrow \infty$ 时，有：

{%raw%}
$\frac{1}{B_{n}^{2+\delta}} \sum_{k=1}^{n} \mathbb{E}\left[\left|X_{k}-\mu_{k}\right|^{2+\delta}\right] \rightarrow 0$

{%endraw%}

则随机变量之和 $\overline{S X_{n}}=\sum_{k=1}^{n} X_{k}$ 的标准变化量:

{%raw%}
$Z_{n}=\frac{\overline{S X_{n}}-\mathbb{E}\left[\overline{S X_{n}}\right]}{\sqrt{\operatorname{Var}\left[\overline{S X_{n}}\right]}}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}}$
{%endraw%}

概率分布函数 $F_{n}(x)$ 对于任意 $x$ 满足:

{%raw%}
$\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim _{n \rightarrow \infty} P\left\{Z_{n} \leq x\right\}=\lim _{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-\sum_{k=1}^{n} \mu_{k}}{B_{n}} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array}$
{%endraw%}

其物理意义为：

相互独立的随机变量 $X_{1}, X_{2}, \cdots, X_{n}, \cdots$ 之和 $\overline{S X_{n}}=\sum_{k=1}^{n} X_{k}$ 的衍生随机变量序列 $Z_{n}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}},$ 当 $n$ 充分大时, 其分布近似与标准正态分布。
这里并不要求 $X_{1}, X_{2}, \cdots, X_{n}, \cdots$ 同分布。

棣莫佛－拉普拉斯定理

Demoiver-Laplace 定理：设随机变量序列 $\eta_{n}, n=1,2, \ldots$ 服从参数为 $(n, p)$ 的二项分布，其中 $0 < p < 1$ 则对于任意 $x$ , 有:

{%raw%}
$\lim _{n \rightarrow \infty} P\left\{\frac{\eta_{n}-n p}{\sqrt{n p(1-p)}} \leq x\right\}=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} \mid 2} d t=\Phi(x)$
{%endraw%}

该定理表明, 正态分布是二项分布的极限分布。当 $n$ 充分大时，可以利用正态分布来计算二项分布的概率。

参考资料

https://baike.baidu.com/item/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86/829451?fr=aladdin
https://baijiahao.baidu.com/s?id=1665261046335447411&wfr=spider&for=pc
http://www.huaxiaozhuan.com/%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/2_probability.html
https://www.zhihu.com/question/25956080/answer/1375064657
https://zhuanlan.zhihu.com/p/93738110

苍蓝儿

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
概率论基础 - 9 - 中心极限定理

中心极限定理（Central Limit Theorem，CTL），是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。。概述定理是数理统计学和误差分析的理论基础，指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理，有广泛的实际应用背景。在自然界与生产中，一些现象受到许多相互独立的随机因素的影响，如果每个因素所产生的影响都很微小时，总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。 ——百度百科中心极限定理（CLT）指出，如果样.
复制链接

扫一扫

专栏目录