文章目录
Intro
主要包括两个方面:极限定理们(intro部分以Bernoulli试验为例)和收敛性。极限定理包括:中心极限定理(CLT),强大数定律(SLLN),弱大数定律(WLLN)。收敛性包括:依概率收敛、依分布收敛、几乎必然收敛、r阶收敛。
依概率收敛
设
ξ
1
,
⋯
,
ξ
n
\xi_1,\cdots,\xi_n
ξ1,⋯,ξn是一列随机变量,
ξ
\xi
ξ是随机变量,如果对
∀
ϵ
>
0
\forall \epsilon>0
∀ϵ>0都有
lim
n
→
∞
P
(
∣
ξ
n
−
ξ
∣
≥
ϵ
)
=
0
\lim_{n\to\infty}P(|\xi_n-\xi|\ge\epsilon) = 0
n→∞limP(∣ξn−ξ∣≥ϵ)=0
则称
ξ
n
\xi_n
ξn依概率收敛到
ξ
\xi
ξ,记为
ξ
n
→
P
ξ
.
\xi_n\overset{P}\to\xi.
ξn→Pξ.
定义中的 ≥ ϵ \ge\epsilon ≥ϵ可以改为 > ϵ >\epsilon >ϵ。原因如下:
如果
ξ
n
\xi_n
ξn依概率收敛到
ξ
\xi
ξ,由于
P
(
∣
ξ
n
−
ξ
∣
≥
ϵ
)
≥
P
(
∣
ξ
n
−
ξ
∣
>
ϵ
)
≥
0
P(|\xi_n-\xi|\ge\epsilon)\ge P(|\xi_n-\xi|>\epsilon) \ge 0
P(∣ξn−ξ∣≥ϵ)≥P(∣ξn−ξ∣>ϵ)≥0
故
lim
n
→
∞
P
(
∣
ξ
n
−
ξ
∣
>
ϵ
)
=
0
\lim_{n\to\infty} P(|\xi_n-\xi|>\epsilon) = 0
n→∞limP(∣ξn−ξ∣>ϵ)=0
另一方面,假设对
∀
ϵ
>
0
\forall \epsilon > 0
∀ϵ>0,
lim
n
→
P
(
∣
ξ
n
−
ξ
∣
>
1
2
ϵ
)
=
0
P
(
∣
ξ
n
−
ξ
∣
≥
ϵ
)
≤
P
(
∣
ξ
n
−
ξ
∣
>
1
2
ϵ
)
\lim_{n\to}P(|\xi_n-\xi|>\frac12\epsilon) = 0\\ P(|\xi_n - \xi|\ge \epsilon) \le P(|\xi_n - \xi|>\frac12\epsilon)
n→limP(∣ξn−ξ∣>21ϵ)=0P(∣ξn−ξ∣≥ϵ)≤P(∣ξn−ξ∣>21ϵ)
因此由夹逼原理,反面也成立。
弱大数定律
ξ
1
,
ξ
2
,
⋯
,
ξ
n
\xi_1,\xi_2,\cdots,\xi_n
ξ1,ξ2,⋯,ξn是一列随机变量,
S
n
=
∑
i
=
1
n
ξ
i
S_n = \sum_{i=1}^n \xi_i
Sn=∑i=1nξi,
S
n
b
n
−
a
n
→
P
0
\dfrac{S_n}{b_n}-a_n\overset{P}\to 0
bnSn−an→P0
则称
X
n
X_n
Xn满足弱大数定律。
对于Bernoulli试验场合,可以直接验证:
P
(
∣
S
n
n
−
E
X
∣
≥
ϵ
)
≤
v
a
r
(
S
n
)
n
2
ϵ
2
=
p
q
n
ϵ
2
→
0
P(|\frac{S_n}{n}-EX|\ge\epsilon) \le \dfrac{var(S_n)}{n^2\epsilon^2} = \dfrac{pq}{n\epsilon^2}\to0
P(∣nSn−EX∣≥ϵ)≤n2ϵ2var(Sn)=nϵ2pq→0
因此
B
e
r
n
o
u
l
l
i
Bernoulli
Bernoulli试验满足弱大数定律,频率作为一个随机变量随机变量
S
n
n
\dfrac{S_n}{n}
nSn依概率收敛到均值。
几乎必然收敛
如果
P
(
lim
n
→
∞
ξ
n
=
ξ
)
=
1
P(\lim_{n\to\infty}\xi_n = \xi) = 1
P(n→∞limξn=ξ)=1
则称
ξ
n
\xi_n
ξn几乎必然收敛到
ξ
\xi
ξ,记作
ξ
n
→
a
.
s
.
ξ
\xi_n\overset{a.s.}\to\xi
ξn→a.s.ξ。
强大数定律
如果
S
n
b
n
−
a
n
→
a
.
s
.
0
\frac{S_n}{b_n}-a_n\overset{a.s.}\to 0
bnSn−an→a.s.0
则称
ξ
n
\xi_n
ξn满足强大数定律。
依分布收敛
如果 lim n → ∞ F ξ n ( x ) = F ξ ( x ) \lim_{n\to\infty}F_{\xi_n}(x) = F_{\xi}(x) limn→∞Fξn(x)=Fξ(x)对 F ξ ( x ) F_{\xi}(x) Fξ(x)的连续点都成立,则称 ξ n \xi_n ξn依分布收敛到 ξ \xi ξ,记作 ξ n → d ξ . \xi_n\overset{d}\to\xi. ξn→dξ.
中心极限定理
S n ∗ = S n − E S n v a r S n S_n^* = \frac{S_n-ES_n}{\sqrt{varS_n}} Sn∗=varSnSn−ESn
若 S n ∗ → d Z ∼ N ( 0 , 1 ) S_n^*\overset{d}\to Z\sim N(0,1) Sn∗→dZ∼N(0,1),则称 ξ n \xi_n ξn满足中心极限定理。
r阶收敛
如果
lim
n
→
∞
E
∣
ξ
n
−
ξ
∣
r
=
0
\lim_{n\to\infty} E|\xi_n-\xi|^r = 0
n→∞limE∣ξn−ξ∣r=0
则称
ξ
n
r
\xi_nr
ξnr阶收敛到
ξ
\xi
ξ。记作
ξ
n
→
r
ξ
\xi_{n}\overset{r}\to \xi
ξn→rξ.
收敛的强弱关系
最强: r r r阶收敛、几乎必然收敛,两者不能互相推导。
居中:依概率收敛
最弱:依分布收敛
弱大数定律与依概率收敛
依概率收敛的命题
-
唯一性: ξ n → P ξ , ξ n → P η \xi_n\overset{P}\to\xi,\xi_n\overset{P}\to\eta ξn→Pξ,ξn→Pη,则 ξ = a . s . η \xi \overset{a.s.}= \eta ξ=a.s.η.
证明:
∀ ϵ > 0 , P ( ∣ ξ − η ∣ > ϵ ) = P ( ∣ ξ − ξ n + ξ n − η ∣ > ϵ ) ≤ P ( ∣ ξ − ξ n ∣ > 1 2 ϵ ) + P ( ∣ ξ n − η ∣ > 1 2 ϵ ) P ( ∣ ξ − η ∣ ≠ 0 ) = lim ϵ → 0 P ( ∣ ξ − η ∣ > ϵ ) = 0 \forall \epsilon > 0, P(|\xi-\eta| > \epsilon) = P(|\xi-\xi_n+\xi_n-\eta| > \epsilon) \le P(|\xi-\xi_n|>\frac12 \epsilon)+P(|\xi_n-\eta|>\frac12\epsilon)\\ P(|\xi-\eta| \ne 0) = \lim_{\epsilon \to 0}P(|\xi-\eta|>\epsilon) = 0 ∀ϵ>0,P(∣ξ−η∣>ϵ)=P(∣ξ−ξn+ξn−η∣>ϵ)≤P(∣ξ−ξn∣>21ϵ)+P(∣ξn−η∣>21ϵ)P(∣ξ−η∣=0)=ϵ→0limP(∣ξ−η∣>ϵ)=0 -
X n → P X ⇒ X n − X → P 0 X_n\overset{P}\to X\Rightarrow X_n-X\overset{P}\to 0 Xn→PX⇒Xn−X→P0.
证明:
∀ ϵ > 0 , lim n → ∞ P ( ∣ X n − X − 0 ∣ > ϵ ) = 0 \forall \epsilon > 0, \lim_{n\to\infty}P(|X_n-X- 0|>\epsilon) = 0 ∀ϵ>0,n→∞limP(∣Xn−X−0∣>ϵ)=0 -
X n → P X , X n − X m → P 0 ( n , m → ∞ ) X_n\overset{P}\to X,X_n-X_m\overset{P}\to0(n,m\to\infty) Xn→PX,Xn−Xm→P0(n,m→∞).
证明:
P ( ∣ X n − X m ∣ > ϵ ) ≤ P ( ∣ X n − X ∣ > 1 2 ϵ ) + P ( ∣ X m − X ∣ > 1 2 ϵ ) → 0 P(|X_n-X_m|>\epsilon) \le P(|X_n-X|>\frac12\epsilon)+P(|X_m-X|>\frac12\epsilon) \to 0 P(∣Xn−Xm∣>ϵ)≤P(∣Xn−X∣>21ϵ)+P(∣Xm−X∣>21ϵ)→0 -
X n → P X , Y n → P Y ⇒ X n ± Y n → P X ± Y X_n\overset{P}\to X,Y_n\overset P \to Y\Rightarrow X_n\pm Y_n\overset P\to X\pm Y Xn→PX,Yn→PY⇒Xn±Yn→PX±Y.
证明:
P ( ∣ X n + Y n − X − Y ∣ ≥ ϵ ) ≤ P ( ∣ X n − X ∣ ≥ 1 2 ϵ ) + P ( ∣ Y n − Y ∣ ≥ 1 2 ϵ ) → 0 P(|X_n+Y_n-X-Y|\ge\epsilon) \le P(|X_n-X|\ge\frac12\epsilon) + P(|Y_n-Y|\ge\frac12\epsilon)\to 0 P(∣Xn+Yn−X−Y∣≥ϵ)≤P(∣Xn−X∣≥21ϵ)+P(∣Yn−Y∣≥21ϵ)→0 -
X n → P X ⇒ k X n → P k X X_n\overset P\to X\Rightarrow kX_n\overset{P}\to kX Xn→PX⇒kXn→PkX.
证明:
P ( ∣ k X n − k X ∣ ≥ ϵ ) = P ( X n − X ∣ ≥ ϵ k ) → 0 P(|kX_n-kX|\ge\epsilon) = P(X_n-X|\ge\frac \epsilon k)\to 0 P(∣kXn−kX∣≥ϵ)=P(Xn−X∣≥kϵ)→0 -
X n → P X ⇒ X n 2 → P X 2 X_n\overset P\to X\Rightarrow X_n^2\overset P\to X^2 Xn→PX⇒Xn2→PX2.
证明:对随机变量 X X X,对任意 δ > 0 \delta>0 δ>0,存在充分大的 M > 0 M>0 M>0,使得
P ( ∣ X ∣ > M 2 ) < δ 4 P(|X|> \frac M2) <\frac\delta 4\\ P(∣X∣>2M)<4δ
这时候,存在充分大的 n n n满足
P ( ∣ X n − X ∣ > M 2 ) < δ 4 P(|X_n-X|>\frac M2) < \frac \delta 4 P(∣Xn−X∣>2M)<4δ则
P ( ∣ X n ∣ > M ) < P ( ∣ X ∣ > M 2 ) + P ( ∣ X n − X ∣ > M 2 ) < δ 2 P(|X_n|>M) < P(|X|>\frac M2) + P(|X_n-X|>\frac M2) < \frac \delta 2 P(∣Xn∣>M)<P(∣X∣>2M)+P(∣Xn−X∣>2M)<2δ再对满足上述要求的 n n n提更高的要求:对任意的 ∀ ϵ > 0 \forall \epsilon > 0 ∀ϵ>0,使得
P ( ∣ X n − X ∣ ≥ ϵ M ) < δ 2 P(|X_n-X|\ge\frac{\epsilon}{M}) < \frac\delta 2 P(∣Xn−X∣≥Mϵ)<2δ
综上,
P ( ∣ X n ∣ ∣ X n − X ∣ > ϵ ) < P ( ∣ X n − X ∣ > ϵ M ) + P ( ∣ X n ∣ > M ) < δ P(|X_n||X_n-X|>\epsilon) < P(|X_n-X|>\frac{\epsilon}{M}) + P(|X_n|>M) < \delta P(∣Xn∣∣Xn−X∣>ϵ)<P(∣Xn−X∣>Mϵ)+P(∣Xn∣>M)<δP ( ∣ X ∣ ∣ X n − X ∣ > ϵ ) < δ P(|X||X_n-X| > \epsilon) < \delta P(∣X∣∣Xn−X∣>ϵ)<δ
梳理一下逻辑:给定一个 ϵ > 0 \epsilon>0 ϵ>0后,对任意的 δ \delta δ都有当 n n n充分大时, P ( ∣ X n 2 − X n X ∣ > ϵ ) < δ , P ( ∣ X X n − X 2 ∣ ) < δ P(|X_n^2-X_nX|>\epsilon) < \delta,P(|XX_n-X^2|)<\delta P(∣Xn2−XnX∣>ϵ)<δ,P(∣XXn−X2∣)<δ.即
X n 2 − X n X → P 0 , X X n − X 2 → P 0. X_n^2-X_nX\overset P\to 0, XX_n-X^2\overset P\to 0. Xn2−XnX→P0,XXn−X2→P0.
由命题5,
X n 2 − X 2 → P 0 X_n^2-X^2\overset P \to 0 Xn2−X2→P0 -
X n → P a , Y n → P b , a , b X_n\overset P\to a, Y_n\overset P\to b,a,b Xn→Pa,Yn→Pb,a,b常数,证明 X n Y n → P a b . X_nY_n\overset P\to ab. XnYn→Pab.
证明:
由和的性质, X n + Y n → P a + b X_n+Y_n\overset P \to a+b Xn+Yn→Pa+b,再由平方的性质, X n 2 + Y n 2 + 2 X n Y n → P a 2 + b 2 + 2 a b X_n^2+Y_n^2+2X_nY_n\overset P \to a^2+b^2+2ab Xn2+Yn2+2XnYn→Pa2+b2+2ab,再由平方的性质得
X n Y n → P a b . X_nY_n\overset P\to ab. XnYn→Pab. -
X n → P 1 ⇒ X n − 1 → P 1. X_n\overset P\to 1\Rightarrow X_n^{-1}\overset P\to 1. Xn→P1⇒Xn−1→P1.
证明:
P ( ∣ 1 X n − 1 ∣ > ϵ ) ≤ P ( ∣ 1 − X n ∣ > 1 2 ϵ ) + P ( ∣ X n ∣ < 1 2 ) → 0 P(|\frac1 {X_n}-1|>\epsilon) \le P(|1-X_n|>\frac12\epsilon)+P(|X_n|<\frac12)\to0 P(∣Xn1−1∣>ϵ)≤P(∣1−Xn∣>21ϵ)+P(∣Xn∣<21)→0 -
X n → P a , Y n → P b , a , b X_n\overset P\to a,Y_n\overset P\to b,a,b Xn→Pa,Yn→Pb,a,b常数, b ≠ 0 , ⇒ X n Y n − 1 → P a b − 1 . b\ne 0,\Rightarrow X_nY_n^{-1}\overset P \to ab^{-1}. b=0,⇒XnYn−1→Pab−1.
证明:略。
-
X n → P X , Y X_n\overset P \to X,Y Xn→PX,Y是随机变量,证明: X n Y → P X Y X_nY\overset P\to XY XnY→PXY.
证明:
P ( ∣ X n Y − X Y ∣ > ϵ ) < P ( ∣ Y ∣ > M ) + P ( ∣ X n − X ∣ > ϵ M ) → 0 P(|X_nY-XY|>\epsilon) < P(|Y|>M) + P(|X_n-X|>\frac \epsilon M) \to 0 P(∣XnY−XY∣>ϵ)<P(∣Y∣>M)+P(∣Xn−X∣>Mϵ)→0 -
X n → P X , Y n → P Y X_n\overset P\to X,Y_n\overset P\to Y Xn→PX,Yn→PY,则 X n Y n → P X Y . X_nY_n\overset P\to XY. XnYn→PXY.
证明:
X n − X → P 0 , Y n − Y → P 0 , X n Y n − X Y n − X n Y + X Y → P 0. X_n-X\overset P\to 0,Y_n-Y\overset P\to 0,X_nY_n-XY_n-X_nY+XY\overset P\to 0. Xn−X→P0,Yn−Y→P0,XnYn−XYn−XnY+XY→P0. -
X n → P X X_n\overset P\to X Xn→PX, g g g是 R R R上的连续函数,试证: g ( X n ) → P g ( X ) . g(X_n)\overset P\to g(X). g(Xn)→Pg(X).
证明:考虑在 [ − M , M ] [-M,M] [−M,M]上的性质。不妨假设 X n , X X_n,X Xn,X都在 [ − M , M ] [-M,M] [−M,M]内,否则最后加上他们超出这个范围的概率,这个概率可以很小。
对任意 ϵ > 0 , ∃ δ > 0 , ∣ x − y ∣ < δ , ∣ g ( x ) − g ( y ) ∣ < ϵ . \epsilon>0,\exists \delta>0,|x-y|<\delta,|g(x)-g(y)|<\epsilon. ϵ>0,∃δ>0,∣x−y∣<δ,∣g(x)−g(y)∣<ϵ.(一致连续)
P ( ∣ g ( X n ) − g ( X ) ∣ > ϵ ) < P ( ∣ X n − X ∣ ≥ δ ) + P ( ∣ g ( X n ) − g ( X ) ∣ > ϵ , ∣ X n − X ∣ < δ ) → 0 P(|g(X_n)-g(X)|>\epsilon) < P(|X_n-X|\ge\delta) + P(|g(X_n)-g(X)|>\epsilon,|X_n-X|<\delta) \to 0 P(∣g(Xn)−g(X)∣>ϵ)<P(∣Xn−X∣≥δ)+P(∣g(Xn)−g(X)∣>ϵ,∣Xn−X∣<δ)→0
总结一下,所有的性质包括:
(1)四则运算封闭: X n → X , Y n → Y X_n\to X,Y_n\to Y Xn→X,Yn→Y,无论 X , Y X,Y X,Y是常数或是随机变量,都满足四则运算封闭。
(2)连续函数作用封闭。
(3)柯西收敛定理。
与r阶收敛的关系
r阶收敛可以推出依概率收敛,原因如下
P
(
∣
X
n
−
X
∣
≥
ϵ
)
≤
E
∣
X
n
−
X
∣
r
ϵ
r
P(|X_n-X|\ge\epsilon) \le E\dfrac{|X_n-X|^r}{\epsilon^r}
P(∣Xn−X∣≥ϵ)≤Eϵr∣Xn−X∣r
于是,当我们要证明依概率收敛,一般采用的方式就是利用切比雪夫不等式或者计算r阶矩。
切比雪夫WLLN
假设 X 1 , X 2 , ⋯ X_1,X_2,\cdots X1,X2,⋯两两不相关,且 v a r ( X i ) ≤ M var(X_i)\le M var(Xi)≤M( ∀ i , \forall i, ∀i,方差有界),则
S n − E S n n → P 0. \dfrac{S_n-ES_n}{n} \overset P\to 0. nSn−ESn→P0.
证明:
P
(
∣
S
n
−
E
S
n
n
∣
≥
ϵ
)
≤
v
a
r
(
S
n
)
n
2
ϵ
2
≤
M
n
ϵ
2
→
0
P(|\dfrac{S_n-ES_n}{n}|\ge\epsilon) \le \dfrac{var(S_n)}{n^2\epsilon^2} \le \dfrac{M}{n\epsilon^2}\to0
P(∣nSn−ESn∣≥ϵ)≤n2ϵ2var(Sn)≤nϵ2M→0
马尔可夫WLLN
把切比雪夫方差有界的条件改为 v a r ( S n ) = o ( n 2 ) var(S_n) = o(n^2) var(Sn)=o(n2)。
伯努利WLLN
就是之前证明过的,bernoulli场合的试验。注意的是和前面两个不一样,这里要求随机变量独立。
泊松WLLN
Bernoulli的投币中,改成每次投的硬币都不一样,即概率为 p 1 , p 2 , ⋯ , p k , ⋯ p_1,p_2,\cdots,p_k,\cdots p1,p2,⋯,pk,⋯。
强大数定律与几乎必然收敛
由几乎必然收敛的定义,
P
(
lim
n
→
∞
ξ
n
=
ξ
)
=
1
P(\lim_{n\to\infty} \xi_n = \xi) = 1
P(n→∞limξn=ξ)=1
ω
∈
{
lim
n
→
∞
ξ
n
(
ω
)
=
ξ
(
ω
)
}
\omega\in\{\lim_{n\to\infty}\xi_n(\omega)= \xi(\omega)\}
ω∈{limn→∞ξn(ω)=ξ(ω)}的意思是说,
∀
ϵ
>
0
,
∃
N
≥
1
,
∀
n
≥
N
,
∣
ξ
n
(
ω
)
−
ξ
(
ω
)
∣
<
ϵ
\forall \epsilon > 0,\exists N \ge 1,\forall n\ge N,|\xi_n(\omega)-\xi(\omega)|<\epsilon
∀ϵ>0,∃N≥1,∀n≥N,∣ξn(ω)−ξ(ω)∣<ϵ
那么
ω
∉
{
lim
n
→
∞
ξ
n
(
ω
)
=
ξ
(
ω
)
}
=
A
\omega\notin\{\lim_{n\to\infty}\xi_n(\omega) = \xi(\omega)\} = A
ω∈/{limn→∞ξn(ω)=ξ(ω)}=A的意思是说,
∃
ϵ
>
0
,
∀
N
≥
1
,
∃
n
≥
N
,
∣
ξ
n
(
ω
)
−
ξ
(
ω
)
∣
≥
ϵ
\exists \epsilon > 0,\forall N\ge 1,\exists n \ge N,|\xi_n(\omega)-\xi(\omega)|\ge \epsilon
∃ϵ>0,∀N≥1,∃n≥N,∣ξn(ω)−ξ(ω)∣≥ϵ
读解这个事件,记事件
A
n
,
ϵ
=
{
ω
:
∣
{
ξ
n
(
ω
)
−
ξ
(
ω
)
∣
>
ϵ
}
A_{n,\epsilon} = \{\omega:|\{\xi_n(\omega)-\xi(\omega)| > \epsilon\}
An,ϵ={ω:∣{ξn(ω)−ξ(ω)∣>ϵ},它与
n
,
ϵ
n,\epsilon
n,ϵ有关。
A
=
⋃
ϵ
>
0
⋂
N
≥
1
⋃
n
≥
N
A
n
,
ϵ
A = \bigcup_{\epsilon>0}\bigcap_{N\ge1}\bigcup_{n\ge N} A_{n,\epsilon}\\
A=ϵ>0⋃N≥1⋂n≥N⋃An,ϵ
注意到,
ϵ
→
0
\epsilon\to0
ϵ→0的过程中,后面那个事件列是单调上升的,而
A
A
A就是这个事件列单调上升的极限。又
P
(
A
)
=
0
P(A) = 0
P(A)=0
则
P
(
⋂
N
≥
1
⋃
n
≥
N
A
n
,
ϵ
)
=
0
,
∀
ϵ
>
0
P(\bigcap_{N\ge1}\bigcup_{n\ge N}A_{n,\epsilon}) = 0,\forall \epsilon>0
P(N≥1⋂n≥N⋃An,ϵ)=0,∀ϵ>0
再观察这个事件列。当
N
→
∞
N\to\infty
N→∞的过程中,
⋃
n
≥
N
A
n
,
ϵ
\bigcup_{n\ge N}A_{n,\epsilon}
⋃n≥NAn,ϵ单调下降,对
N
N
N取交,实际上是
lim sup
n
→
∞
A
n
,
ϵ
=
⋂
N
≥
1
⋃
n
≥
N
A
n
,
ϵ
=
↓
lim
N
→
∞
⋃
n
≥
N
A
n
,
ϵ
\limsup_{n\to\infty} A_{n,\epsilon}=\bigcap_{N\ge 1}\bigcup_{n\ge N}A_{n,\epsilon} = \downarrow\lim_{N\to\infty} \bigcup_{n\ge N} A_{n,\epsilon}
n→∞limsupAn,ϵ=N≥1⋂n≥N⋃An,ϵ=↓N→∞limn≥N⋃An,ϵ
从另一个角度看,把交集读解为“任意”,并集读解为“存在”,上极限事件也可以认为是:对任意的
N
N
N,都存在
N
N
N之后的一个
n
n
n,使得
A
n
A_n
An发生。因此
A
n
A_n
An发生了无穷多次。更本质地,如果
ω
∈
lim sup
n
→
∞
A
n
\omega\in\limsup_{n\to\infty} A_n
ω∈n→∞limsupAn,那么给定一个
N
N
N,存在
N
N
N之后的
n
n
n使得
ω
∈
A
n
\omega\in A_n
ω∈An,记这个
n
=
n
1
n=n_1
n=n1,再根据任意性,存在
n
1
n_1
n1之后的
n
2
n_2
n2使得
ω
∈
A
n
2
,
⋯
\omega\in A_{n_2},\cdots
ω∈An2,⋯因此,
ω
\omega
ω可以使
A
n
A_n
An发生无穷多次。故我们也把上极限事件称为
A
n
i
.
o
.
A_ni.o.
Ani.o.(infinitely often)。这样一来,结论就是:
几乎必然收敛 ⟺ \iff ⟺对 ∀ ϵ \forall \epsilon ∀ϵ, P ( A n , ϵ i . o . ) = 0. P(A_{n,\epsilon}i.o.) = 0. P(An,ϵi.o.)=0.
Borel-cantelli引理
令 s = ∑ n = 1 ∞ P ( A n ) . s = \sum_{n=1}^\infty P(A_n). s=∑n=1∞P(An).
(1)若 s < ∞ s<\infty s<∞,则 P ( A n i . o . ) = 0. P(A_ni.o.)=0. P(Ani.o.)=0.
(2)若 A 1 , A 2 , ⋯ A_1,A_2,\cdots A1,A2,⋯相互独立, s = ∞ s=\infty s=∞,则 P ( A n i . o . ) = 1 P(A_ni.o.) = 1 P(Ani.o.)=1.
证明:
(1)
P
(
A
n
i
.
o
.
)
=
P
(
lim
N
→
∞
⋃
n
≥
N
A
n
)
≤
P
(
⋃
n
≥
N
A
n
)
≤
∑
n
=
N
∞
P
(
A
n
)
→
0.
P(A_ni.o.) = P(\lim_{N\to\infty}\bigcup_{n\ge N} A_{n})\le P(\bigcup_{n\ge N}A_n)\le\sum_{n=N}^\infty P(A_n) \to 0.
P(Ani.o.)=P(N→∞limn≥N⋃An)≤P(n≥N⋃An)≤n=N∑∞P(An)→0.
(2)
P
(
A
n
i
.
o
.
)
=
P
(
lim
N
→
∞
⋃
n
≥
N
A
n
)
=
lim
N
→
∞
P
(
⋃
n
≥
N
A
n
)
lim
N
→
∞
P
(
⋃
n
≥
N
A
n
)
=
lim
n
→
∞
(
1
−
P
(
⋂
n
=
N
∞
A
n
)
)
=
1
−
lim
N
→
∞
∏
n
=
N
∞
(
1
−
P
(
A
n
)
)
≥
1
−
e
−
∑
n
=
N
∞
P
(
A
n
)
→
1
P(A_n i.o.) = P(\lim_{N\to\infty}\bigcup_{n\ge N} A_n) = \lim_{N\to\infty} P(\bigcup_{n\ge N}A_n)\\ \lim_{N\to \infty} P(\bigcup_{n\ge N} A_n) = \lim_{n\to\infty}(1-P(\bigcap_{n=N}^\infty A_n)) = 1-\lim_{N\to\infty}\prod_{n=N}^\infty (1-P(A_n)) \ge 1-e^{-\sum_{n=N}^\infty} P(A_n)\to 1
P(Ani.o.)=P(N→∞limn≥N⋃An)=N→∞limP(n≥N⋃An)N→∞limP(n≥N⋃An)=n→∞lim(1−P(n=N⋂∞An))=1−N→∞limn=N∏∞(1−P(An))≥1−e−∑n=N∞P(An)→1
因此,我们可以用
P
(
∣
ξ
1
−
ξ
∣
>
ϵ
)
+
P
(
∣
ξ
2
−
ξ
∣
>
ϵ
)
+
⋯
<
∞
P(|\xi_1-\xi|>\epsilon) + P(|\xi_2-\xi|>\epsilon) +\cdots <\infty
P(∣ξ1−ξ∣>ϵ)+P(∣ξ2−ξ∣>ϵ)+⋯<∞
来证明
ξ
n
→
a
.
s
.
ξ
\xi_n\overset{a.s.}\to\xi
ξn→a.s.ξ.
与其他收敛的关系
ξ n → a . s . ξ ⇒ ξ n → P ξ \xi_n\overset{a.s.} \to \xi \Rightarrow \xi_n\overset{P}\to \xi\\ ξn→a.s.ξ⇒ξn→Pξ
但是, ξ n → P ξ \xi_n\overset{P}\to \xi ξn→Pξ,则存在 ξ n \xi_n ξn的一个子列几乎必然收敛到 ξ \xi ξ.
反过来,如果对于 ξ n \xi_n ξn的任意一个子列,都存在一个更小的子列使得 ξ n i \xi_{n_i} ξni几乎必然收敛到 ξ \xi ξ,则 ξ n \xi_n ξn依概率收敛到 ξ \xi ξ.
Borel-Cantelli’s SLLN
如果
X
1
,
X
2
,
⋯
X_1,X_2,\cdots
X1,X2,⋯相互独立,
E
(
X
i
−
E
X
i
)
4
≤
M
,
∀
i
E(X_i-EX_i)^4\le M,\forall i
E(Xi−EXi)4≤M,∀i,则
S
n
−
E
S
n
n
→
a
.
s
.
0.
\dfrac{S_n-ES_n}{n}\overset{a.s.}\to 0.
nSn−ESn→a.s.0.
证明:不妨设
E
X
i
=
0
EX_i = 0
EXi=0,否则令
Y
i
=
X
i
−
E
X
i
Y_i = X_i-EX_i
Yi=Xi−EXi,
S
n
−
E
S
n
=
X
1
+
⋯
+
X
n
−
E
X
1
−
⋯
−
E
X
n
=
Y
1
+
⋯
+
Y
n
.
S_n-ES_n = X_1+\cdots+X_n-EX_1-\cdots -EX_n = Y_1+\cdots+Y_n.
Sn−ESn=X1+⋯+Xn−EX1−⋯−EXn=Y1+⋯+Yn.
则由chebyshev Inequality,
P
(
∣
S
n
n
∣
≥
ϵ
)
≤
E
S
n
4
n
4
ϵ
4
P(|\dfrac{S_n}{n}|\ge\epsilon) \le \dfrac{ES_n^4}{n^4\epsilon^4}
P(∣nSn∣≥ϵ)≤n4ϵ4ESn4
计算
S
n
4
S_n^4
Sn4,它包含下面这些项的期望:
X
i
4
,
X
i
3
X
j
,
X
i
2
X
j
X
k
,
X
i
2
X
j
2
,
X
i
X
j
X
k
X
l
X_i^4,X_i^3X_j,X_i^2X_jX_k,X_i^2X_j^2,X_iX_jX_kX_l
Xi4,Xi3Xj,Xi2XjXk,Xi2Xj2,XiXjXkXl
其中只有
X
i
4
,
X
i
2
X
j
2
X_i^4,X_i^2X_j^2
Xi4,Xi2Xj2的期望不为0。则
E
S
n
4
=
∑
i
=
1
n
E
X
i
4
+
∑
i
<
j
E
X
i
2
X
j
2
≤
n
M
+
∑
i
<
j
E
X
i
4
E
X
j
4
≤
n
M
+
C
n
2
C
4
2
M
≤
3
n
2
M
ES_n^4 = \sum_{i=1}^n EX_i^4 + \sum_{i<j} EX_i^2 X_j^2\le nM + \sum_{i<j}\sqrt{EX_i^4EX_j^4} \le nM + C_n^2C_4^2M \le 3n^2M
ESn4=i=1∑nEXi4+i<j∑EXi2Xj2≤nM+i<j∑EXi4EXj4≤nM+Cn2C42M≤3n2M
因此
P
(
A
n
)
≤
3
M
n
2
ϵ
4
∑
n
=
1
∞
P
(
A
n
)
=
3
M
ϵ
4
∑
n
=
1
∞
1
n
2
<
∞
P(A_n)\le \frac{3M}{n^2\epsilon^4}\\ \sum_{n=1}^\infty P(A_n) = \frac {3M}{\epsilon^4}\sum_{n=1}^\infty\frac1{n^2} <\infty
P(An)≤n2ϵ43Mn=1∑∞P(An)=ϵ43Mn=1∑∞n21<∞
由
B
o
r
e
l
−
C
a
n
t
e
l
l
i
Borel-Cantelli
Borel−Cantelli引理,几乎必然收敛成立。
Kolmogorov’s SLLN
这个定律叙述的是i.i.d.序列的强大数定律。
假设 X 1 , ⋯ X_1,\cdots X1,⋯独立同分布,若 E X EX EX存在,则 S n n → a . s . E X \dfrac{S_n}{n}\overset{a.s.}\to EX nSn→a.s.EX.
这条的直观含义是,期望的时间平均会几乎必然收敛到空间平均。
反过来,如果 S n n → a . s . a ∈ R \dfrac{S_n}{n}\overset{a.s.}\to a\in \R nSn→a.s.a∈R,则 E X ∃ , E X = a . EX\exists,EX = a. EX∃,EX=a.
假如某列随机变量 Y n Y_n Yn几乎必然收敛到 Y Y Y,则 Y Y Y是退化的。因为 Y Y Y与自己独立。 P ( Y ≤ a ) = P ( Y ≤ a ) P ( Y ≤ a ) P(Y\le a) = P(Y\le a)P(Y\le a) P(Y≤a)=P(Y≤a)P(Y≤a),于是必然存在某个 a a a使得 P ( Y ≤ a ) = 1 P(Y\le a ) = 1 P(Y≤a)=1,之前都是0。 Y Y Y在点 a a a的概率就为1.
中心极限定理与依分布收敛
与其他收敛的关系
依概率收敛可以推出依分布收敛。
如果依分布收敛到 C ∈ R C\in \R C∈R,则可以推出依概率收敛到 C C C.
证明:不妨设
C
=
0
C = 0
C=0,若不然,考虑
ξ
n
−
C
\xi_n-C
ξn−C。
P
(
∣
ξ
n
∣
≤
ϵ
)
≥
F
ξ
n
(
ϵ
)
−
F
ξ
n
(
−
ϵ
)
→
F
(
ϵ
)
−
F
(
−
ϵ
)
=
1
P(|\xi_n|\le \epsilon) \ge F_{\xi_n}(\epsilon) - F_{\xi_{n}}(-\epsilon) \to F(\epsilon)-F(-\epsilon) = 1
P(∣ξn∣≤ϵ)≥Fξn(ϵ)−Fξn(−ϵ)→F(ϵ)−F(−ϵ)=1
依分布收敛的等价条件
(1) ξ n → d ξ ⟺ E f ( ξ n ) → E f ( ξ ) , ∀ f : R → R \xi_n\overset{d}\to \xi \iff Ef(\xi_n)\to Ef(\xi),\forall f:\R\to\R ξn→dξ⟺Ef(ξn)→Ef(ξ),∀f:R→R有界连续。
(2) ξ n → d ξ ⟺ f ξ n ( t ) → f ξ ( t ) , ∀ t . \xi_n\overset d\to\xi\iff f_{\xi_n}(t)\to f_{\xi}(t),\forall t. ξn→dξ⟺fξn(t)→fξ(t),∀t.
若 f ξ n ( t ) → f ( t ) , ∀ t f_{\xi_n}(t)\to f(t),\forall t fξn(t)→f(t),∀t,且在 t = 0 t=0 t=0处连续,则 f f f是特征函数。
Lindeberg-Levy CLT
假设
X
1
,
X
2
,
⋯
X_1,X_2,\cdots
X1,X2,⋯独立同分布,
0
<
v
a
r
(
X
)
<
∞
.
0<var(X)<\infty.
0<var(X)<∞.则
S
n
∗
→
d
Z
∼
N
(
0
,
1
)
S_n^*\overset{d}\to Z\sim N(0,1)
Sn∗→dZ∼N(0,1)
应用:
P
(
S
n
≤
x
)
=
P
(
S
n
∗
≤
x
∗
)
=
Φ
(
x
∗
)
=
p
,
x
∗
=
x
−
E
S
n
v
a
r
(
S
n
)
P(S_n\le x)=P(S_n^*\le x^*) = \Phi(x*)=p,x^* = \dfrac{x-ES_n}{\sqrt{var(S_n)}}
P(Sn≤x)=P(Sn∗≤x∗)=Φ(x∗)=p,x∗=var(Sn)x−ESn
三类问题:
-
已知 n , x n,x n,x,求 p p p.
[例]浦丰试验投掷硬币4040次,正面2048次,计算当重复浦丰试验时,正面出现的频率和概率之差的偏离程度不大于浦丰试验中所发生的的偏离的概率。
解:
依题意得要求
p = P ( ∣ S 4040 4040 − 1 2 ∣ ≤ 28 4040 ) p = P(|\dfrac {S_{4040}}{4040}-\frac12|\le \frac{28}{4040}) p=P(∣4040S4040−21∣≤404028)
标准化:
p = P ( ∣ S 4040 ∗ ∣ ≤ 56 4040 4040 ) = 2 Φ ( ∗ ) − 1 p = P(|S_{4040}^*|\le \dfrac{56\sqrt {4040}}{4040}) = 2 \Phi(*) - 1 p=P(∣S4040∗∣≤4040564040)=2Φ(∗)−1 -
已知 x , p x,p x,p,求 n n n.
[例]某品牌往常的市场占有率为15%,今公司决定再做一次抽样调查,要求误差小于1%的概率达到95%,问至少要抽多少户?
解:
依题意得要求最小的 x x x满足
P ( ∣ S n − 0.15 n n ∣ ≤ 0.01 ) ≥ 0.95 P(|\dfrac{S_n-0.15n}{n}|\le0.01)\ge 0.95\\ P(∣nSn−0.15n∣≤0.01)≥0.95
标准化
P ( ∣ S n ∗ ∣ ≤ 0.01 n 0.15 ∗ 0.85 ) ≥ 0.95 P(|S_n^{*}|\le \frac{0.01\sqrt{n}}{\sqrt{0.15*0.85}})\ge0.95 P(∣Sn∗∣≤0.15∗0.850.01n)≥0.95 -
已知 n , p n,p n,p,求 x x x.
懒得列举了。
注意:当用正态分布逼近二项分布时,需要用修正公式调整:
P
(
k
1
≤
S
n
≤
k
2
)
=
Φ
(
k
2
−
n
p
n
p
q
)
−
Φ
(
k
1
−
n
p
n
p
q
)
P(k_1\le S_n\le k_2) = \Phi(\dfrac{k_2-np}{\sqrt{npq}}) - \Phi(\dfrac{k_1-np}{\sqrt{npq}})
P(k1≤Sn≤k2)=Φ(npqk2−np)−Φ(npqk1−np)
[例]车间有200台车床,每台的功率为1千瓦,开动频率为60%,要求正常生产的把握至少为99.9%,问:需要多少千瓦电力?
解:
求的是
P
(
S
200
≤
x
)
≥
0.999
P(S_{200}\le x)\ge0.999
P(S200≤x)≥0.999
让
Φ
(
x
−
200
∗
0.6
+
0.5
200
∗
0.6
∗
0.4
)
−
Φ
(
−
200
∗
0.6
−
0.5
200
∗
0.6
∗
0.4
)
≥
0.999
\Phi(\dfrac{x-200*0.6+0.5}{\sqrt{200*0.6*0.4}}) - \Phi(\dfrac{-200*0.6-0.5}{\sqrt{200*0.6*0.4}}) \ge 0.999
Φ(200∗0.6∗0.4x−200∗0.6+0.5)−Φ(200∗0.6∗0.4−200∗0.6−0.5)≥0.999
Lindeberg-Feller’s CLT
叙述:
X
1
,
X
2
,
⋯
X_1,X_2,\cdots
X1,X2,⋯相互独立,
E
X
k
=
μ
k
,
v
a
r
(
X
k
)
=
σ
k
2
.
EX_k = \mu_k,var(X_k) = \sigma_k^2.
EXk=μk,var(Xk)=σk2.记
B
n
2
=
∑
k
=
1
n
σ
k
2
B_n^2 = \sum_{k=1}^n \sigma_k^2
Bn2=k=1∑nσk2
L
i
n
d
e
b
e
r
g
Lindeberg
Lindeberg条件:
1
B
n
2
∑
k
=
1
n
E
∣
X
k
−
μ
k
∣
2
1
{
∣
X
k
−
μ
k
∣
>
ϵ
B
n
}
→
0
,
∀
ϵ
>
0
\dfrac{1}{B_n^2}\sum_{k=1}^n E|X_k-\mu_k|^2 1_{\{|X_k-\mu_k|>\epsilon B_n\}} \to 0,\forall \epsilon > 0
Bn21k=1∑nE∣Xk−μk∣21{∣Xk−μk∣>ϵBn}→0,∀ϵ>0
中心极限定理:
S
n
∗
=
S
n
−
E
S
n
v
a
r
S
n
→
d
Z
∼
N
(
0
,
1
)
S_n^* = \dfrac{S_n-ES_n}{\sqrt{varSn}}\overset{d}\to Z\sim N(0,1)
Sn∗=varSnSn−ESn→dZ∼N(0,1)
F
e
l
l
e
r
Feller
Feller条件:
KaTeX parse error: Undefined control sequence: \and at position 66: …B_n\to\infty\ \̲a̲n̲d̲ ̲\frac{\sigma_n}…
则成立
L
i
n
d
e
b
e
r
g
Lindeberg
Lindeberg条件的充要条件是中心极限定理成立且
F
e
l
l
e
r
Feller
Feller条件成立。