【统计类知识】大数定律与中心极限定理

最新推荐文章于 2024-03-22 14:54:49 发布

卖山楂啦prss

最新推荐文章于 2024-03-22 14:54:49 发布

阅读量1k

点赞数

分类专栏：统计学

本文链接：https://blog.csdn.net/qq_42374697/article/details/114265445

版权

统计学专栏收录该内容

45 篇文章 236 订阅

订阅专栏

文章目录

一、背景
二、大数定律
三、中心极限定理
- （1）独立同分布中心极限定理
- （2）棣莫弗—拉普拉斯中心极限定理
四、大数定律与中心极限定理之间的区别

一、背景

事件发生的频率具有稳定性，即随着试验次数的增加，事件发生的频率逐渐稳定于某个常数，这一事实表明可以用一个数来表征事件发生的可能性大小，这使人们认识到概率是客观存在的，进而由频率的三条性质的启发和抽象给出了概率的定义，而频率的稳定性是概率定义的客观基础。

二、大数定律

通常，在进行大量重复试验时，事件发生的频率会越来越稳定于它的概率，这里提到的“稳定”一词就是指随机试验结果依概率收敛于某个确定的值，这就是 “大数定律”

参考某博主的观点就是

大数定律讲的是样本均值收敛到总体均值

也可以理解为大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。

下面简单的介绍一下这几个定律

切比雪夫不等式

若随机变量 $X$ 的期望 $E X$ 和方差 $V a r X$ 都存在，则对任意的 $\varepsilon >0$ ，有

$P\left( \left| X-EX \right|\ge \varepsilon \right) \le \frac{VarX}{\varepsilon ^2}$

或者
$P\left( \left| X-EX \right|<\varepsilon \right) \ge 1-\frac{VarX}{\varepsilon ^2}$

这个定律强调期望与方差都存在，一般只需方差存在即可。

（1）切比雪夫大数定律

如果随机变量序列 $\left\{ X_n\text{，}n\ge 1 \right\}$ 满足如下三个条件：

序列中任意有限多个随机变量都相互独立；
期望 $EX_1\text{，}EX_2\text{，}\cdots \text{，}EX_n$ 与方差 $VarX_1\text{，}VarX_2\text{，}\cdots \text{，}VarX_n$ 都存在；
方差一致有界，即存在 $M > 0$ ，使得 $VarX_i\le M\text{，}i=1,2\cdots$

对任意的 $\varepsilon >0$ ，有

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}} \right|\ge \varepsilon \right) =0$

或者

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}} \right|<\varepsilon \right) =1$

上式可以写成
$\frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}}\xrightarrow{p}0$

即该定律说明，当 $n$ 充分大时，算术平均值 $\overline{X}=\frac{1}{n}\sum_{i=1}^n{X_i}$ 密集分布在它的期望 $E\overline{X_n}$ 的附近。

（2）伯努力大数定律

在每次成功概率为 $p$ 的伯努利试验序列中，若用 $\mu _n$ 表示前 $n$ 次试验中成功的次数，则对任意的 $\varepsilon >0$ ，有

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{\mu _n}{n}-p \right|\ge \varepsilon \right) =0$
或者

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{\mu _n}{n}-p \right|<\varepsilon \right) =1$

该定律表明，频率稳定于概率

（3）辛钦大数定律

设随机变量序列 $\left\{ X_n\text{，}n\ge 1 \right\}$ 满足一下三个条件

相互独立
同分布
期望 $EX_i=\mu$ 存在， $i=1,2,\cdots$

则对任意的 $\varepsilon >0$ ，有

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\mu} \right|\ge \varepsilon \right) =0$
或者

$\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\mu} \right|<\varepsilon \right) =1$

三、中心极限定理

概念：

如果总体变量存在有限的平均数和方差，那么无论这个总体变量的分布如何，随着抽样单位数 $n$ 的增加，抽样平均数便趋近于正态分布。

也就是

来自某总体的一个样本，无论该总体服从什么分布，只要样本容量足够大，其样本均值都近似服从正态分布。注意“样本均值“近似正态，而不是样本本身服从正态

在这里插入图片描述

要了解中心定理的来龙去脉，推荐参考抽样分布之中心极限定理(Central Limit Theorem)

引用其中一部分内容：
在这里插入图片描述

在这里插入图片描述

（1）独立同分布中心极限定理

设随机变量序列 $\left\{ X_n\text{，}n\ge 1 \right\}$ 满足一下三个条件

相互独立
同分布
期望 $EX_i=\mu$ 和方差 $VarX_i=\sigma ^2$ ， $i=1,2,\cdots$ ，都存在

则对任意的 $\varepsilon >0$ ，有

$\underset{n\rightarrow \infty}{\lim}P\left( \frac{\sum_{i=1}^n{X_i}-n\mu}{\sqrt{n}\sigma}\le x \right) =\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x{e^{-\frac{t^2}{2}}}dt$

按照依分布收敛的语言，可以写成

$\frac{\sum_{i=1}^n{X_i}-n\mu}{\sqrt{n}\sigma}\xrightarrow{d}N\left( 0,1 \right)$

（2）棣莫弗—拉普拉斯中心极限定理

二项分布的正态逼近

棣莫弗—拉普拉斯中心极限定理是独立同分布中心极限定理的特例

在每次成功概率为 p 的伯努利试验序列中，若用 $\mu _n$ 表示前 n 次试验中成功的次数，则对任意的 $x\in R$ ，有

$\underset{n\rightarrow \infty}{\lim}P\left( \frac{\mu _n-np}{\sqrt{np\left( 1-p \right)}}\le x \right) =\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x{e^{-\frac{t^2}{2}}}dt$
按照依分布收敛的语言，可以写成

$\frac{\mu _n-np}{\sqrt{np\left( 1-p \right)}}\xrightarrow{d}N\left( 0,1 \right)$

四、大数定律与中心极限定理之间的区别

这里引用详细解释大数定律+中心极限定理（三）观点

在这里插入图片描述

卖山楂啦prss

关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
1
评论
【统计类知识】大数定律与中心极限定理

一、背景在第一章我们提到过事件发生的频率具有稳定性，即随着试验次数的增加，事件发生的频率逐渐稳定于某个常数，这一事实显示了可以用一个数来表征事件发生的可能性大小，这使人们认识到概率是客观存在的，进而由频率的三条性质的启发和抽象给出了概率的定义，而频率的稳定性是概率定义的客观基础。在实践中人们还认识到大量测量值的算术平均值也具有稳定性，而这种稳定性就是本节所要讨论的大数定律的客观背景，而这些理论正是概率论的理论基础。1.为何能以某事件发生的频率作为该事件的概率的估计？2.为何能以样本均值作为总体期望的估
复制链接

扫一扫