文章目录
一、背景
事件发生的频率具有稳定性,即随着试验次数的增加,事件发生的频率逐渐稳定于某个常数,这一事实表明可以用一个数来表征事件发生的可能性大小,这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,而频率的稳定性是概率定义的客观基础。
二、大数定律
通常,在进行大量重复试验时,事件发生的频率会越来越稳定于它的概率,这里提到的“稳定”一词就是指随机试验结果依概率收敛于某个确定的值,这就是 “大数定律”
参考某博主的观点就是
大数定律讲的是样本均值收敛到总体均值
也可以理解为大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。
下面简单的介绍一下这几个定律
切比雪夫不等式
若随机变量 X X X 的期望 E X EX EX 和方差 V a r X VarX VarX 都存在,则对任意的 ε > 0 \varepsilon >0 ε>0 ,有
P ( ∣ X − E X ∣ ≥ ε ) ≤ V a r X ε 2 P\left( \left| X-EX \right|\ge \varepsilon \right) \le \frac{VarX}{\varepsilon ^2} P(∣X−EX∣≥ε)≤ε2VarX
或者
P
(
∣
X
−
E
X
∣
<
ε
)
≥
1
−
V
a
r
X
ε
2
P\left( \left| X-EX \right|<\varepsilon \right) \ge 1-\frac{VarX}{\varepsilon ^2}
P(∣X−EX∣<ε)≥1−ε2VarX
这个定律强调期望与方差都存在,一般只需方差存在即可。
(1)切比雪夫大数定律
如果随机变量序列 { X n , n ≥ 1 } \left\{ X_n\text{,}n\ge 1 \right\} {Xn,n≥1} 满足如下三个条件:
- 序列中任意有限多个随机变量都相互独立;
- 期望 E X 1 , E X 2 , ⋯ , E X n EX_1\text{,}EX_2\text{,}\cdots \text{,}EX_n EX1,EX2,⋯,EXn 与方差 V a r X 1 , V a r X 2 , ⋯ , V a r X n VarX_1\text{,}VarX_2\text{,}\cdots \text{,}VarX_n VarX1,VarX2,⋯,VarXn 都存在;
- 方差一致有界,即存在 M > 0 M>0 M>0 ,使得 V a r X i ≤ M , i = 1 , 2 ⋯ VarX_i\le M\text{,}i=1,2\cdots VarXi≤M,i=1,2⋯
对任意的 ε > 0 \varepsilon >0 ε>0 ,有
lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E X i ∣ ≥ ε ) = 0 \underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}} \right|\ge \varepsilon \right) =0 n→∞limP(∣∣∣∣∣n1i=1∑nXi−n1i=1∑nEXi∣∣∣∣∣≥ε)=0
或者
lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E X i ∣ < ε ) = 1 \underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}} \right|<\varepsilon \right) =1 n→∞limP(∣∣∣∣∣n1i=1∑nXi−n1i=1∑nEXi∣∣∣∣∣<ε)=1
上式可以写成
1
n
∑
i
=
1
n
X
i
−
1
n
∑
i
=
1
n
E
X
i
→
p
0
\frac{1}{n}\sum_{i=1}^n{X_i-\frac{1}{n}\sum_{i=1}^n{EX_i}}\xrightarrow{p}0
n1i=1∑nXi−n1i=1∑nEXip0
即该定律说明,当 n n n 充分大时,算术平均值 X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum_{i=1}^n{X_i} X=n1∑i=1nXi 密集分布在它的期望 E X n ‾ E\overline{X_n} EXn 的附近。
(2)伯努力大数定律
在每次成功概率为 p p p 的伯努利试验序列中,若用 μ n \mu _n μn 表示前 n n n 次试验中成功的次数,则对任意的 ε > 0 \varepsilon >0 ε>0 ,有
lim
n
→
∞
P
(
∣
μ
n
n
−
p
∣
≥
ε
)
=
0
\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{\mu _n}{n}-p \right|\ge \varepsilon \right) =0
n→∞limP(∣∣∣nμn−p∣∣∣≥ε)=0
或者
lim n → ∞ P ( ∣ μ n n − p ∣ < ε ) = 1 \underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{\mu _n}{n}-p \right|<\varepsilon \right) =1 n→∞limP(∣∣∣nμn−p∣∣∣<ε)=1
该定律表明,频率稳定于概率
(3)辛钦大数定律
设随机变量序列 { X n , n ≥ 1 } \left\{ X_n\text{,}n\ge 1 \right\} {Xn,n≥1} 满足一下三个条件
- 相互独立
- 同分布
- 期望 E X i = μ EX_i=\mu EXi=μ 存在, i = 1 , 2 , ⋯ i=1,2,\cdots i=1,2,⋯
则对任意的 ε > 0 \varepsilon >0 ε>0 ,有
lim
n
→
∞
P
(
∣
1
n
∑
i
=
1
n
X
i
−
μ
∣
≥
ε
)
=
0
\underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\mu} \right|\ge \varepsilon \right) =0
n→∞limP(∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣≥ε)=0
或者
lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − μ ∣ < ε ) = 1 \underset{n\rightarrow \infty}{\lim}P\left( \left| \frac{1}{n}\sum_{i=1}^n{X_i-\mu} \right|<\varepsilon \right) =1 n→∞limP(∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣<ε)=1
三、中心极限定理
概念:
如果总体变量存在有限的平均数和方差,那么无论这个总体变量的分布如何,随着抽样单位数 n n n 的增加,抽样平均数便趋近于正态分布。
也就是
来自某总体的一个样本,无论该总体服从什么分布,只要样本容量足够大,其样本均值都近似服从正态分布。注意“样本均值“近似正态,而不是样本本身服从正态
要了解中心定理的来龙去脉,推荐参考抽样分布之中心极限定理(Central Limit Theorem)
引用其中一部分内容:
(1)独立同分布中心极限定理
设随机变量序列 { X n , n ≥ 1 } \left\{ X_n\text{,}n\ge 1 \right\} {Xn,n≥1} 满足一下三个条件
- 相互独立
- 同分布
- 期望 E X i = μ EX_i=\mu EXi=μ 和方差 V a r X i = σ 2 VarX_i=\sigma ^2 VarXi=σ2 , i = 1 , 2 , ⋯ i=1,2,\cdots i=1,2,⋯,都存在
则对任意的 ε > 0 \varepsilon >0 ε>0 ,有
lim n → ∞ P ( ∑ i = 1 n X i − n μ n σ ≤ x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t \underset{n\rightarrow \infty}{\lim}P\left( \frac{\sum_{i=1}^n{X_i}-n\mu}{\sqrt{n}\sigma}\le x \right) =\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x{e^{-\frac{t^2}{2}}}dt n→∞limP(nσ∑i=1nXi−nμ≤x)=2π1∫−∞xe−2t2dt
按照依分布收敛的语言,可以写成
∑ i = 1 n X i − n μ n σ → d N ( 0 , 1 ) \frac{\sum_{i=1}^n{X_i}-n\mu}{\sqrt{n}\sigma}\xrightarrow{d}N\left( 0,1 \right) nσ∑i=1nXi−nμdN(0,1)
(2)棣莫弗—拉普拉斯中心极限定理
二项分布的正态逼近
棣莫弗—拉普拉斯中心极限定理是独立同分布中心极限定理的特例
在每次成功概率为 p 的伯努利试验序列中,若用 μ n \mu _n μn 表示前 n 次试验中成功的次数,则对任意的 x ∈ R x\in R x∈R ,有
lim
n
→
∞
P
(
μ
n
−
n
p
n
p
(
1
−
p
)
≤
x
)
=
1
2
π
∫
−
∞
x
e
−
t
2
2
d
t
\underset{n\rightarrow \infty}{\lim}P\left( \frac{\mu _n-np}{\sqrt{np\left( 1-p \right)}}\le x \right) =\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x{e^{-\frac{t^2}{2}}}dt
n→∞limP(np(1−p)μn−np≤x)=2π1∫−∞xe−2t2dt
按照依分布收敛的语言,可以写成
μ n − n p n p ( 1 − p ) → d N ( 0 , 1 ) \frac{\mu _n-np}{\sqrt{np\left( 1-p \right)}}\xrightarrow{d}N\left( 0,1 \right) np(1−p)μn−npdN(0,1)
四、大数定律与中心极限定理之间的区别
这里引用 详细解释大数定律+中心极限定理(三)观点